Huggingface không chỉ là một biểu tượng cảm xúc dễ thương trên smartphone
Nếu bạn đang tìm kiếm cộng đồng AI để tìm hiểu về các mô hình AI và cách sử dụng chúng trong công việc của mình, Huggingface.co là một sự lựa chọn tuyệt vời. Trang web này cung cấp một loạt các mô hình AI và công cụ để giúp bạn xây dựng và triển khai các ứng dụng AI của riêng mình.
Trong bài viết này, tôi sẽ giới thiệu Huggingface.co và bước đầu sử dụng các mô hình AI mã nguồn mở từ website này.
Nội dung chính
I. Giới thiệu Huggingface.co
We’re on a journey to advance and democratize NLP for everyone. Along the way, we contribute to the development of technology for the better.
Hugginface.co
Huggingface là một công ty cung cấp các công cụ và AI model để giúp các nhà phát triển xây dựng các ứng dụng AI. Huggingface đặc biệt nổi tiếng với Huggingface Transformers, trước khi ChatGPT ra mắt thì đây là một trong những thư viện quen thuộc mà tôi tìm hiểu để sử dụng cho các nhiệm vụ xử lý ngôn ngữ tự nhiên.
Bạn có thể dễ dàng nhận ra các công ty công nghệ hàng đầu đều tham gia Huggingface và “host” AI model của mình tại đây. Một số cái tên lớn như: OpenAI, Google, Meta AI (Facebook), Microsoft. Trong đó Google và Meta đóng góp hơn 500 model, còn Microsoft thì khiêm tốn hơn với số lượng 243.
Trên trang web Huggingface.co, bạn có thể tìm thấy các mô hình AI được đào tạo sẵn cho nhiều tác vụ khác nhau như Natural Language Processing (NLP), Computer Vision, Text to Speech, Speecth to text, vv Ngoài ra, bạn cũng có thể tải xuống các mã nguồn để triển khai các mô hình AI trên các ứng dụng của mình.
Lợi ích của việc sử dụng Huggingface.co
-
Các mô hình AI chất lượng cao: Các mô hình AI trên Huggingface.co được đào tạo bằng dữ liệu lớn và có chất lượng cao. Bạn có thể sử dụng các mô hình này để giải quyết các vấn đề liên quan đến NLP (Natural Language Processing – xử lý ngôn ngữ tự nhiên) và Data Mining (khai thác dữ liệu).
-
Thư viện mã nguồn mở: Huggingface.co là một cộng đồng mã nguồn mở. Bạn có thể tải xuống và sử dụng mã nguồn của các mô hình AI để triển khai các ứng dụng AI của riêng mình. Điều này cũng đồng nghĩa với việc bạn có thể đóng góp cho cộng đồng bằng cách cung cấp mã nguồn và các mô hình AI của riêng mình.
-
Tiết kiệm thời gian và chi phí: Nếu bạn đang phát triển một ứng dụng AI, việc xây dựng một mô hình AI từ đầu có thể mất rất nhiều thời gian và chi phí. Sử dụng các mô hình AI trên Huggingface.co sẽ giúp bạn tiết kiệm nguồn lực của mình một cách đáng kể.
-
Hỗ trợ Python và API: Hầu hết các AI model có mặt trên Huggingface.co hỗ trợ python theo mặc định, ngoài ra họ cung cấp Hosted inference API cho phép gọi HTTP request để thực thi các nhiệm vụ cần sử dụng AI model. Như vậy có nghĩa là gần như bạn có thể sử dụng tính năng AI từ bất kỳ ngôn ngữ nào cho phép gọi HTTP request thông qua API.
-
Cộng đồng các chuyên gia hàng đầu: Huggingface.co là một cộng đồng AI lớn, có nhiều chuyên gia và nhà phát triển trong lĩnh vực AI. Bạn có thể tìm kiếm sự trợ giúp và đóng góp từ các thành viên khác cho các dự án của mình tại đây.
Các mô hình AI trên Huggingface.co
Các mô hình AI trên Huggingface.co được phân loại theo các tác vụ rất đa dạng như Natural Language Processing (NLP), Computer Vision, Audio, vv. Dưới đây là một số ví dụ về các mô hình AI trên Huggingface.co:

Mô hình GPT-2
GPT-2 là một mô hình tạo văn bản mạnh mẽ do OpenAI phát triển, được đào tạo trên dữ liệu lớn. Nó có thể tạo ra các đoạn văn bản tự nhiên và chân thực, giúp giải quyết nhiều vấn đề liên quan đến sinh văn bản. Bạn có thể sử dụng GPT-2 để tạo ra các bài viết, phản hồi trả lời tự động hoặc tạo nội dung cho các sản phẩm của bạn.
Mô hình BERT
BERT (Bidirectional Encoder Representations from Transformers) là một mô hình AI do Google phát triển và công bố năm 2018, được đào tạo trên dữ liệu lớn để giải quyết các vấn đề liên quan đến xử lý ngôn ngữ tự nhiên. Nó có thể giúp bạn giải quyết các tác vụ như phân loại văn bản, dịch thuật và tóm tắt văn bản. Bạn có thể sử dụng BERT để giải quyết các vấn đề liên quan đến xử lý ngôn ngữ tự nhiên trong ứng dụng của mình.
Mô hình T5 (Text-To-Text Transfer Transformer)
T5 là một mô hình AI do Google Research phát triển, được đào tạo trên dữ liệu lớn để giải quyết các vấn đề liên quan đến tạo văn bản (tương tự như GPT của OpenAI mà bạn nghe tới gần đây). Nó có thể được sử dụng để tạo ra các đoạn văn bản tự nhiên, dịch thuật và phát hiện tình huống trong các câu chuyện. Bạn có thể sử dụng T5 để giải quyết các vấn đề liên quan đến xử lý ngôn ngữ tự nhiên trong ứng dụng của mình.
Làm thế nào để bắt đầu sử dụng Huggingface.co?
Để bắt đầu sử dụng Huggingface.co, bạn cần truy cập vào trang web của nó và đăng ký tài khoản. Sau khi đăng nhập, bạn có thể tìm kiếm các mô hình AI trên Huggingface.co và kết nối với Google Colab để sử dụng, đảm bảo bạn có đủ sức mạnh GPU để chạy model.
Bạn cũng có thể sử dụng Huggingface Transformers, một thư viện Python được thiết kế để hỗ trợ sử dụng các mô hình AI trên Huggingface.co. Thư viện này cho phép bạn tải các mô hình AI từ Huggingface.co và sử dụng chúng trong ứng dụng Python của mình.
Sử dụng Hugginingface model trên Google Colab
Để sử dụng một AI model bất kỳ trên Huggingface, bạn chỉ cần tìm model đó tìm đoạn code mẫu trong phần mô tả, thường là mục How to use, copy vào một Notebook bất kỳ trên Google Colab và chạy để train AI model. Lưu ý: nhớ bật Runtime type là GPU để tối ưu sức mạnh của Google Colab chạy AI model.

Hầu hết các project sử dụng model từ Huggingface đều cần cài đặt thư viện Huggingface Transformers, trên Google Colab có thể chạy câu lệnh sau trong một code cell (ô chứa dòng lệnh)
pip install transformers
Sau khi cài đặt thành công, bạn có thể sử dụng các mô hình AI từ Huggingface.co trong ứng dụng Python của mình. Dưới đây là một ví dụ hoàn chỉnh về cách sử dụng mô hình GPT-2 trên Huggingface.co trong Python:
Trong ví dụ trên, chúng tôi sử dụng mô hình GPT-2 trên Huggingface.co để tạo ra một đoạn văn bản mới từ một đoạn văn bản đã cho. Chúng tôi sử dụng GPT2Tokenizer để mã hóa đoạn văn bản đầu vào và sau đó sử dụng GPT2Model để tạo ra đoạn văn bản mới. Bạn có thể click vào icon Open in Colab từ notebook trên Github để mở ví dụ trên và thử chạy model. Nếu Google Colab là khái niệm mới với bạn, hãy đọc qua bài hướng dẫn sử dụng Google Colab rất chi tiết của tôi đã chia sẻ.
Tạo Huggingface user access token
Bạn sẽ cần tạo user access token để chạy Inference API tới một số AI model có trên Huggingface, điển hình là Stable Diffusion. Hãy đọc qua hướng dẫn chính thức khá ngắn gọn và dễ hiểu tại đây.
Tôi đã từng giới thiệu một tutorial về Tạo ảnh nghệ thuật bằng AI với mô hình Stable Diffusion hoàn toàn miễn phí sử dụng Huggingface. Các bạn có thể xem video chi tiết tại đây.
Tài nguyên học tập
Hunggingface cung cấp tài nguyên miễn phí rất chi tiết, bạn có thể tìm hiểu thêm về các Khoá học và tài liệu tại đây:
- Khoá học: Huggingface Course
- Tài liệu: Huggingface Docs
Kết luận
Huggingface.co là một cộng đồng AI lớn với nhiều mô hình AI mạnh mẽ và các công cụ hỗ trợ sử dụng các mô hình này. Nếu bạn là một người mới bắt đầu trong lĩnh vực AI, Huggingface.co là một nơi tuyệt vời để bắt đầu học tập và tìm hiểu thêm về các mô hình AI. Nếu bạn là một chuyên gia về dữ liệu hoặc là một nhà tiếp thị, bạn cũng có thể tận dụng các mô hình AI trên Huggingface.co để tích hợp vào workflow (quy trình công việc) của mình.
Việc sử dụng các mô hình AI trên Huggingface.co có thể giúp bạn giải quyết nhiều vấn đề liên quan đến xử lý ngôn ngữ tự nhiên và xử lý hình ảnh. Với Huggingface Transformers, bạn có thể sử dụng các mô hình AI trên Huggingface.co trong ứng dụng Python của mình với một vài dòng mã đơn giản.
Nếu bạn là một người mới bắt đầu với Huggingface.co và các AI model, hãy bắt đầu với một trong những mô hình đơn giản nhất và theo dõi các hướng dẫn từ cộng đồng Huggingface. Tôi cũng sẽ cung cấp thêm các bài hướng dẫn chi tiết cách sử dụng một số model hữu ích trên Huggingface trong thời gian tới để các bạn dễ tiếp cận hơn với AI. Nhờ ChatGPT, có thể nói khái niệm AI trở nên bình dân hơn với rất rất nhiều người, tôi hy vọng có nhiều bạn trẻ năng động ở Việt Nam có niềm đam mê và bắt kịp với xu hướng của thế giới hoặc ít nhất tận dụng thành quả sẵn có của cộng đồng để ứng dụng trong cuộc sống của mình.
Chúc các bạn thành công với hành trình khám phá Huggingface.co ngay hôm nay!