Chuyển âm thanh thành văn bản cover

Chuyển giọng nói thành văn bản miễn phí bằng OpenAI whisper trong 3 bước

Kể từ khi đọc được thông tin về mô hình máy học Whisper giúp chuyển giọng nói thành văn bản bởi OpenAI vào tháng 9/2022 tôi nhận thấy đây sẽ là một công nghệ rất thiết thực trong cuộc sống. Sau một thời gian theo dõi và thử nghiệm, tôi cũng đã sử dụng thành công mô hình này với Python trên Google Colab. Nhằm giúp những người không quen thuộc với lập trình cũng có thể sử dụng whisper, tôi viết thư viện python ur_audio_sub và tối giản hết sức các câu lệnh cần thiết giúp chuyển giọng nói thành văn bản. Whisper giúp nhận diện giọng nói từ nhiều ngôn ngữ khác nhau trong đó ~15 ngôn ngữ có tỉ lệ sai số 10%. Trong tutorial này, tôi sẽ hướng dẫn các bạn tạo phụ đề cho youtube video và chuyển đổi file ghi âm thành văn bản chỉ với 3 bước cực kỳ đơn giản.

Huong dan su dung Obsidian thinhvu scaled

Hướng dẫn sử dụng Obsidian toàn tập

Obsidian là một ứng dụng ghi chú và quản lý kiến thức cá nhân mạnh mẽ giúp bạn có thể hệ thống những kiến thức có giá trị mình tiếp nhận được trong đời sống hàng ngày.

I. Vì sao nên ghi chú với Obsidian?

Trong thời đại kỹ thuật số, chúng ta tiếp xúc với một lượng lớn thông tin hàng ngày về mọi mặt của cuộc sống và tốc độ thay đổi chóng mặt của các kiến thức khiến nhu cầu về một công cụ quản lý kiến thức cá nhân (Personal Knowledge Management, viết tắt là PKM) dần trở nên quan trọng. Một ứng dụng PKM giúp bạn ghi lại và theo dõi các ý tưởng, tổ chức các thông tin thiết yếu và khiến chúng sẵn sàng để truy cập khi cần một cách tiện lợi. Tổ chức tốt một cơ sở dữ liệu cá nhân cũng giúp đầu óc bạn được thư giãn khi không phải ghi nhớ quá nhiều thông tin mà có thể tập trung nhiều hơn vào việc tạo ra các ý tưởng đột phá từ thông tin có được.

Đây là 5 lý do bạn nên bắt đầu sử dụng Obsidian theo kinh nghiệm 2 năm sử dụng của tôi:

Hướng dẫn sử dụng ChatGPT đầy đủ

Hướng dẫn sử dụng ChatGPT đầy đủ

Sau các tutorial về AI/ML model ra mắt cuối năm 2022 gồm Chuyển giọng nói thành văn bản với  OpenAI whispertạo ảnh từ văn bản với Stable Diffusion 2.0, mình tiếp nối chuyên mục này với bài hướng dẫn chi tiết về ChatGPT - công cụ được nói đến rầm rộ trên các phương tiện truyền thông và mạng xã hội về tương lai của AI thay thế nhiều công việc của con người. Chúc các bạn đọc một năm mới Quý Mão mạnh khoẻ, hạnh phúc và thành công ❤️.

I. Giới thiệu

1.1. Chat GPT là gì ?

ChatGPT viết tắt của "Chat Generative Pre-training Transformer" là một công cụ máy học phát triển bởi OpenAI. Đây là một loại mạng thần kinh (neural network) được huấn luyện trên một tập dữ liệu văn bản khổng lồ, cho phép nó tạo ra các phản ứng giống như con người theo yêu cầu của người sử dụng. Nó có thể tạo ra văn bản tự động và trả lời câu hỏi, có thể sử dụng cho nhiều mục đích khác nhau như tạo ra bài viết blog hoặc cuộc trò chuyện tự động.

ChatGPT chính thức ra mắt vào 30/11/2022 và tạo ra chấn động trong cộng đồng công nghệ thế giới về khả năng của nó và đạt kỷ lục khi chỉ mất 5 ngày để thu hút 1 triệu người dùng.

we are having a baby viet nhat ky cho con jpg

Cách viết nhật ký cho con cực đơn giản với Google Docs

Viết nhật ký cho con là một cách giúp bạn lưu giữ những kỷ niệm ấu thơ của con và tâm sự với bé yêu trong suốt chặng đường con khôn lớn. Hình thức này đặc biệt hữu ích khi bạn hay các thành viên trong gia đình không dễ thể hiện cảm xúc với nhau. Trong thời đại kỹ thuật số, hình thức viết nhật ký và định dạng lưu trữ những kỷ niệm đã có nhiều thay đổi nhưng yếu tố cốt lõi mà nhật ký hay thư viết cho con không hề thay đổi nhiều. Đối với những người bận rộn, việc dành một chút thời gian trước khi đi ngủ để hồi tưởng lại những sự kiện xảy ra trong ngày của con và ghi chú một vài dòng vào điện thoại hay máy tính có lẽ sẽ thuận tiện hơn rất nhiều so với việc viết vào nhật ký giấy. Điện thoại cũng là thiết bị lưu giữ ảnh và video chính của đa số người dùng internet hiện nay do đó việc viết nhật ký cho con bằng điện thoại sẽ rất thuận tiện để bạn có thể chèn thêm hình ảnh, video ghi lại những khoảnh khắc đáng nhớ của con yêu. Tôi tin chắc rằng cuốn nhật ký này sẽ là một món quà vô giá cho con khi con đến tuổi trưởng thành. Dưới đây là những chia sẻ từ trải nghiệm làm cha của tôi và cách tôi ghi chú lại hành trình tuyệt vời với con trai mình.

kinh nghiem tu hoc data analysis jpg

10 Kinh nghiệm tự học Data Analysis với Python thành công

“Education is not the learning of FACTS, but the training of the mind to THINK”.

Albert Einstein

Là một người đam mê về Digital Marketing và Data Analysis, tôi dành nhiều thời gian để tự học và cho rằng việc tự đào tạo bản thân đóng vai trò cực kỳ quan trọng trong việc phát triển sự nghiệp của mình. Theo tôi, trường học, viện đào tạo không phải là nơi duy nhất quyết định con đường học tập của bạn. Bạn mới chính là người biết bản thân mình cần gì, bạn làm chủ việc sắp xếp thời gian học linh hoạt và theo tiến độ riêng của mình để đạt kết quả tốt nhất. Thông qua bài viết này tôi sẽ chia sẻ với các bạn những kinh nghiệm trong việc tự học data analysis với Python, hy vọng những điều này cũng có thể áp dụng linh hoạt với việc tự học trong nhiều lĩnh vực khác.

1. "Problem solving" - Kỹ năng giải quyết vấn đề tốt là yếu tố then chốt để thành công

"Nếu cho tôi 6 giờ để đốn hạ một cái cây, tôi sẽ dành 4 giờ đầu để mài sắc lưỡi rìu."

Abraham Lincoln

Kỹ năng giải quyết vấn đề cung cấp cho bạn một phương pháp tư duy toàn diện khi tiếp cận và tìm cách giải quyết bất kỳ vấn đề nào trong cuộc sống, không chỉ riêng việc tự học data analysis.

Tải dữ liệu chứng khoán từ TCBS api

vnstock – Tải dữ liệu chứng khoán với Python qua API

vnstock là gói thư viện Python cho phép tải dữ liệu chứng khoán với cú pháp đơn giản sử dụng dữ liệu đáng tin cậy được cung cấp bởi public api từ Techcombank Security (TCBS) và SSI.

Thư viện này được tôi tạo ra lấy cảm hứng từ investingpy (sử dụng nguồn cấp dữ liệu từ investing.com). Phiên bản đầu tiên của vnstock lần đầu tiên được phát hành ngày 27/2/2022.

Version Download Badge Commit Badge License Badge

Giới thiệu chung

Lý do ra đời của dự án này cũng thật đặc biệt, tôi rất thích phân tích dữ liệu với Python và thử áp dụng vào việc phân tích đầu tư thực tế để nâng cao kỹ năng kỹ thuật và rèn luyện tư duy. Cho đến hiện tại, khi tìm kiếm trên internet về “api dữ liệu chứng khoán”, “nguồn cấp dữ liệu chứng khoán” hay "tải dữ liệu chứng khoán" thì đa phần những cái tên hiện ra đều khá truyền thống như cophieu68, vietstock, cafef mà đặc thù là bạn có thể xem trên web hoặc tải file excel hoặc csv dùng cho phần mềm Amibroker. Một số dịch vụ khác cung cấp api dữ liệu nhưng cần trả phí hoặc thủ tục đăng ký rắc rối trong khi tôi muốn sử dụng cho mục đích nghiên cứu và tiết kiệm chi phí nhất có thể (không cần trả phí càng tốt). Thêm nữa, để giảm thiểu các thao tác truy xuất dữ liệu và đưa vào model tính toán thông thường với Excel mất thời gian, tôi thích sử dụng Google Sheets kết hợp với Python để tự động hoá các khâu phân tích cơ bản. Tất nhiên với một số phân tích và nhóm dữ liệu nhất định, bạn có thể gọi API để kéo data trực tiếp vào Google Colab đơn giản nhưng khi sử dụng ở nhiều môi trường máy tính khác nhau (desktop lẫn server), hay thay đổi giữa các tài khoản Google khác nhau thì việc tạo ra 1 thư viện giúp đơn giản hoá việc tận dụng lại những đoạn code viết sẵn, workbook trở nên thanh thoát và dễ làm việc hơn nhiều.

mail merge gmail feature image

Tự “code” ứng dụng Mail Merge Gmail đơn giản trong 15 phút với Google Apps Script

Một mùa giáng sinh & năm mới nữa lại đến, tôi tin rằng có nhiều bạn sẽ cần gửi email cám ơn/chúc mừng giáng sinh & năm mới cho khách hàng, đối tác và cả bạn bè. Lợi ích của việc cá nhân hoá nội dung email hẳn các bạn đều đã biết. Bạn có thể đạt được điều này dễ dàng với sự hỗ trợ từ các công cụ về Email Marketing. Trong bài viết này tôi xin giới thiệu về Mail Merge Gmail - 1 dự án vui với Google Apps Script giúp bạn tạo và gửi HTML email cá nhân hoá hàng loạt sử dụng chính Gmail của mình hoàn toàn miễn phí. Tôi tin rằng bạn chỉ cần khoảng 15 phút để thực hiện dự án này với chút hiểu biết cơ bản về HTML (hoặc chưa biết cũng chẳng sao vì tôi sẽ hướng dẫn bạn khá chi tiết).

automated facebook ads report to google sheets 2

Cập nhật báo cáo Facebook Ads tự động với Google Sheets và Apps Script

Quảng cáo Facebook từ lâu đã là 1 trong những lựa chọn hàng đầu của các doanh nghiệp, tổ chức và kể cả cá nhân khi muốn thực hiện chiến dịch marketing trên nền tảng mạng xã hội. Không mất nhiều thời gian để tìm kiếm các nội dung hướng dẫn cách chạy quảng cáo facebook hay làm sao để tối ưu chi phí hiệu quả. Tuy nhiên dễ dàng nhận ra rằng sẽ không có nhiều nội dung chất lượng để có thể tham khảo miễn phí vì đơn giản đó là bí quyết, là nghề kiếm cơm của các marketer hay agency. Cá nhân tôi sau nhiều năm làm về performance marketing từ vị trí vận hành cho đến quản lý, không ngừng tìm kiếm những cách làm mới và hiệu quả để giảm bớt gánh nặng của các công việc tay chân ít giá trị thay vào đó là dành thời gian suy nghĩ về các chiến lược, chiến thuật thực sự đem lại hiệu quả cho đội ngũ. Khi làm việc với các doanh nghiệp, agency, SME có thể dễ dàng nhận thấy cách làm việc thủ công tải báo cáo quảng cáo để theo dõi hiệu quả chiến dịch cực kỳ phổ biến, mất nhiều thời gian thao tác và khó theo dõi sát sao tình hình nhưng không nhiều đơn vị có cách giải quyết.

Để thiết lập báo cáo Facebook Ads tự động có thể thấy sẽ thực hiện được bằng 2 cách cơ bản: mua dịch vụ của bên thứ 3 hoặc tự phát triển công cụ thông qua lập trình. Với tuỳ chọn sử dụng dịch vụ của bên thứ 3 thì SuperMetrics là cái tên rất phổ biến có thể bạn đã từng nghe tới. Bạn có thể phải bỏ ra 99EUR/tháng để mua gói dịch vụ cơ bản Supermetrics for Google Sheets hoặc 69 EUR/tháng cho dịch vụ Supermetrics for Data Studio với duy nhất 1 nguồn dữ liệu. Một số công cty có đội ngũ lập trình, sử dụng dịch vụ đám mây bài bản thì có thể tự động hoá quy trình nhập dữ liệu quảng cáo vào database một cách đơn giản nhưng phần đông các marketer tôi gặp không may mắn làm ở các đơn vị như vậy.

Review các phần mềm ghi chú cá nhân

Đâu là ứng dụng ghi chú cá nhân tốt nhất dành cho bạn và tôi?

Khi bàn về việc tìm một ứng dụng ghi chú cá nhân (note-taking app) phù hợp cho nhu cầu soạn thảo văn bản hàng ngày hẳn nhiều người sẽ chẳng bận tâm vì có quá nhiều cái tên được biết đến rộng rãi trên thị trường như Google Docs, MS Word, OneNote, Apple Note, Samsung Note, Google Keep, Evernote hay Notion, vv. Tất cả các ứng dụng trên cơ bản đều có thể bắt đầu sử dụng miễn phí và dường như cũng rất dễ sử dụng. Câu hỏi đặt ra là: "Liệu đó đã là lựa chọn tốt nhất mà bạn có thể sử dụng?"

Với riêng tôi, chọn được một giải pháp ghi chú hoàn chỉnh đáp ứng nhu cầu đa dạng của bản thân, hẳn phải lập thành 1 dự án để nghiên cứu. Thực tế tôi đã tìm tòi, trải nghiệm và từ bỏ khá nhiều cái tên không phù hợp để có giải pháp tốt nhất sau cùng. Hãy cùng tôi tìm hiểu sâu hơn về chủ đề này nhé.

I. Phân loại các phong cách ghi chú thường gặp

G.R.R. Martin, tác giả của bộ tiểu thuyết A Song of Ice and Fire (cái tên đầu tiên của bộ tiểu thuyết này được biết đến rộng rãi hơn đó là Game of Thrones) đã nói:

"Tôi nghĩ có hai kiểu nhà văn, đó là kiến trúc sư (architect) và người làm vườn (gardener). Kiến trúc sư thích lập kế hoạch trước mọi thứ, giống như việc một kiến trúc sư xây dựng một ngôi nhà. Họ biết sẽ có bao nhiêu phòng trong ngôi nhà, loại mái họ sẽ có, dây sẽ chạy ở đâu, loại ống nước nào được dùng. Họ đã thiết kế toàn bộ và in ra trước khi họ đóng tấm ván đầu tiên lên. Những người làm vườn đào một cái hố, thả một hạt giống vào và tưới nước. Họ biết đó là hạt giống gì, họ biết nếu gieo một hạt giống tưởng tượng hay hạt giống bí ẩn hay bất cứ thứ gì. Nhưng khi cây mọc lên và họ tưới nước, họ không biết nó sẽ có bao nhiêu nhánh, họ phát hiện ra khi nó lớn lên. Và tôi giống một người làm vườn nhiều hơn là một kiến trúc sư"

Hướng dẫn sử dụng Google Colab - Google Colab Tutorial 101

Hướng dẫn sử dụng Google Colab đầy đủ – Python Tutorial

Xin chào các bạn, trong bài trước tôi đã giới thiệu đến các bạn bài hướng dẫn Thiết lập Linux server chạy Python tự động sử dụng Oracle Cloud (Always Free) để tạo cho mình môi trường thực thi và lên lịch các Python script hoàn toàn tự động trên server. Đối với những người mới làm quen và bắt đầu học Python có lẽ các bạn sẽ khá bối rối với những khái niệm mới lạ nào là cài đặt Python thuần hay Anaconda, sử dụng Visual Studio Code hay PyCharm, vv để lập trình Python. Chưa hết, khi các bạn sử dụng Macbook thì cách thức thiết lập môi trường thực hành và hành vi của máy lại khác xa với máy tính Windows, khiến việc làm quen và thực hành Python gặp không ít khó khăn. Nếu các bạn biết và sử dụng tốt Google Colab, tôi tin bạn chẳng phải đối mặt với những rắc rối nêu trên. Trong thực tế, Google Colab được tôi chọn sử dụng là môi trường thực hành và lập trình duy nhất cho lớp học Python mà tôi đang hướng dẫn bởi những lợi ích hết sức rõ ràng. Không để các bạn phải đợi lâu thêm nữa, hãy cùng tôi khám phá Bí kíp lập trình Python và phân tích dữ liệu với Python qua hướng dẫn sử dụng Google Colab nhé.

1. Google Colab là gì?

Google Colab là một dạng Jupyter Notebook tùy biến cho phép thực thi Python trên nền tảng đám mây, được cung cấp bởi Google. Sử dụng Google Colab có những lợi ích ưu việt như: sẵn sàng chạy Python ở bất kỳ thiết bị nào có kết nối internet mà không cần cài đặt, chia sẻ và làm việc nhóm dễ dàng, sử dụng miễn phí GPU cho các dự án về AI.