Tag: jupyter notebook

google sheet python

Đọc và xuất dữ liệu Google Sheets với Python & Jupyter Notebook

Xin chào các bạn!

Google Sheets từ lâu đã là 1 công cụ bảng tính cực kỳ hữu ích, quen thuộc với nhiều người trên nền tảng web nhất là trong làm việc nhóm. Thật lòng mà nói, tôi sử dụng Google Sheets trong công việc và cuộc sống hàng ngày còn nhiều hơn bộ công cụ Microsoft Excel trên máy tính nhờ trải nghiệm xuyên suốt trên nhiều thiết bị, những hàm đặc biệt và khả năng mở rộng tính năng thông qua Google Apps Script và các Add on.

Khi sử dụng Python để phân tích dữ liệu, tôi chọn tải dữ liệu trực tiếp từ Google Sheets vào project cho tiện thay vì phải xuất file định dạng csv, xlsx rồi mới tải. Sau khi xử lý xong xuôi, tôi cũng thường xuyên lựa chọn xuất dữ liệu ra Google Sheets để lưu trữ và chia sẻ tới đội nhóm trong công ty và đối tác. Ngoài ra với các ứng dụng web scraping, trích xuất dữ liệu từ các báo thì Google Sheets cũng được chọn để lưu trữ các dữ liệu đã qua xử lý một cách tiện lợi, đính kèm link khi gửi thông tin chi tiết cho người nhận tin.

Thông qua bài hướng dẫn ngắn này, hy vọng các bạn có thể đọc và xuất dữ liệu Google Sheets với Python dễ dàng để ứng dụng vào công việc của mình nhé.

Apache Airflow trên Raspberry Pi Terminal

Phân tích dữ liệu với Python | Bắt đầu với Jupyter Notebook, Google Colaboratory và Rasberry Pi

1. Vì sao chọn phân tích dữ liệu với Python?

1.1. Cơ duyên đến với Python

Tuy đã nghe nói đến Python và đã từng học làm quen qua một số khoá học (đều bỏ dở sau khi học một vài phần lý thuyết mở đầu) thì mình quyết tâm đến với Python bằng một lý do rất tình cờ. Một ngày nọ, chiếc laptop Windows của mình bị hỏng, buộc phải mượn Macbook của vợ để sử dụng và bàng hoàng phát hiện ra Microsoft Power BI không hỗ trợ trên MacOS. Không chỉ có thế, Excel trên MacOS dường như cũng là một thảm hoạ khi không hỗ trợ cài các Plugin quen thuộc như Power Pivot hay Fuzzy Search giống như bản Windows. Ở thời điểm bấy giờ, Power BI là phần mềm mạnh mẽ nhất mình dùng để phân tích dữ liệu và xây dựng các dashboard dùng để phân tích và quản lý toàn bộ các hoạt động Digital Marketing trên công ty. Sau chút bỡ ngỡ với MacOS, mình tin hẳn phải có một giải pháp thay thế nào đó để vừa có thể trải nghiệm MacOS một cách mượt mà nhưng cũng đáp ứng được yêu cầu công việc liên quan nhiều đến xử lý dữ liệu của mình. Và như thế Python xuất hiện như một giải pháp không thể thuyết phục hơn. Mình mất khoảng 10 ngày kể từ Tết dương lịch 2021 để đọc tài liệu trên Oreilly.com và làm quen với Python for Data Science.