Table of Contents

Google Imagen AI – Trình tạo hình ảnh từ văn bản của Google có xịn hơn DALL-E hay Midjourney?
Khám phá

Google Imagen AI – Trình tạo hình ảnh từ văn bản của Google có xịn hơn DALL-E hay Midjourney?

Sự quan tâm đổ dồn vào AI (trí tuệ nhân tạo) dạo gần đây khiến Google buộc phải tham gia cuộc đua công nghệ mới này để đảm bảo giữ được vị thế của mình.

Cuối năm 2021 đánh dấu sự thay đổi lớn của thế giới công nghệ với sự phát triển vũ bão của các công cụ AI như ChatGPT, Bing New hay Google Bard. Và khoảng thời gian trước đó, chúng ta từng biết tới DALL-E hay Midjourney với khả năng tạo ra hình ảnh dựa vào văn bản được người dùng nhập vào đã làm điên đảo cộng đồng các nhà thiết kế.

Bài viết dưới đây của GhienCongNghe sẽ cho bạn biết thêm một công cụ AI mới của Google có tên Imagen. Chúng ta sẽ tìm hiểu về Google Imagen AI là gì? Cách Imagen hoạt động như thế nào? Cách đăng ký dùng thử công cụ mới của Google này như thế nào và so sánh nó với các trình tạo hình ảnh từ văn bản nổi bật khác.

Google Imagen AI là gì?

Imagen AI là một mô hình chuyển đổi văn bản thành hình ảnh do Google phát triển. Imagen AI tiếp tục làm dài thêm danh sách các trình tạo hình ảnh từ văn bản bằng AI (trí tuệ nhân tạo), danh sách trước đó có các cái tên mà bạn có thể đã biết như DALL-E 2, Dream by Wombo và Midjourney. Tất cả chúng đều có thể khả năng tạo ra những hình ảnh tuyệt vời từ mô tả văn bản.

Cũng giống với các trình tạo hình ảnh từ văn bản khác. Bạn chỉ cần cung cấp cho các chương trình AI này bất kỳ từ ngữ mô tả nào bạn muốn. Và chúng sẽ tạo ra những hình ảnh phù hợp với mô tả đó.

Google Imagen AI là gì?

Hình ảnh do AI tạo ra dường như đang chiếm lĩnh internet gần đây và gây nhiều tranh luận giữa nhiếp ảnh gia, nghệ sĩ và cộng đồng các nhà thiết kế và sáng tạo.

Và không có gì ngạc nhiên khi Google sẽ phát triển AI tạo hình ảnh từ văn bản của riêng mình. Tuy nhiên, Imagen AI không hoàn toàn giống như phần còn lại.

Imagen hiện đang bước vào giai đoạn thử nghiệm tiếp theo, thông qua cái mà Google gọi là AI Test Kitchen, một ứng dụng đã ra mắt vào đầu năm nay được thiết kế để cho phép một số người dùng nhất định dùng thử các dịch vụ AI mới của Google.

Sự khác biệt của Google Imagen so với Dall-E và Midjourney

Điều làm cho Imagen trở nên độc đáo là nó được thiết kế để tạo ra hai đầu ra rất cụ thể dựa trên các chức năng có tên City Dreamer và Wobble.

City Dreamer có phần gợi nhớ đến một trò chơi như Sim City, nơi bạn xây dựng các tòa nhà để tạo ra một thị trấn. Với Imagen, bạn có thể mô tả một cái gì đó giống như một ngôi nhà và nó sẽ hiển thị mô tả của bạn thành một hình ảnh.

Sự khác biệt của Google Imagen so với Dall-E và Midjourney

Mặt khác, Wobble tạo ra những sinh vật độc đáo dựa trên mô tả của bạn và chúng trông giống như các nhân vật hoạt hình Pixar. Một số thứ bạn có thể chơi là loại quần áo mà sinh vật sẽ mặc, hoặc sinh vật được làm từ chất liệu gì.

Hình ảnh một chú cáo đội mũ bảo hiểm vũ trụ

Ở cấp độ kỹ thuật, nghiên cứu của Google về hệ thống AI chuyển văn bản thành hình ảnh đã phát hiện ra rằng sử dụng các mô hình ngôn ngữ lớn hơn là chìa khóa để tạo ra hình ảnh chất lượng cao hơn và tăng thêm khả năng tạo hình ảnh phù hợp hơn với mô tả văn bản.

Tuy nhiên, vì bạn bị giới hạn trong việc tạo ra một tòa nhà hoặc một sinh vật, nên rất khó để so sánh Imagen với những thứ như DALL-E hoặc Midjourney. Do đó, để trả lời chính xác cho câu hỏi này, chúng ta phải chờ khoảng thời gian tới, Google sẽ mở rộng Imagen như thế nào.

Tính đến nay, người dẫn đầu trong lĩnh vực tạo hình ảnh bằng AI có thể khẳng định là DALL-E, một chương trình được tạo ra bởi OpenAI (cũng là nhà phát triển công cụ ChatGPT).

Tuy nhiên, Google tuyên bố rằng Imagen luôn tạo ra hình ảnh tốt hơn DALL-E 2, dựa trên một điểm chuẩn mới mà nó tạo ra cho dự án này có tên là DrawBench.

DrawBench không phải là một số liệu đặc biệt phức tạp: về cơ bản nó là một danh sách khoảng 200 lời nhắc văn bản mà nhóm của Google đã đưa vào Imagen và các trình tạo văn bản thành hình ảnh khác, với đầu ra từ mỗi chương trình sau đó được đánh giá bởi con người.

Như biểu đồ bên dưới, Google nhận thấy rằng con người thường thích đầu ra từ Imagen hơn đầu ra của các đối thủ khác.

So sánh Google Imagen với Dall-E và Midjourney

Tuy nhiên, sẽ rất khó để tự đánh giá điều này vì Google không cung cấp mô hình Imagen cho người dùng phổ thông.

Cách dùng thử Google Imagen AI

Hiện tại, Google Imagen AI chỉ được mở cho một nhóm người dùng nhỏ trong quá trình phát hành bản beta, thông qua ứng dụng AI Test Kitchen. Nó mang đến cho Google một cơ hội rất cần thiết để nhận phản hồi từ người dùng và khắc phục mọi sự cố với mô hình AI này trước khi phát hành cho người dùng trải nghiệm.

Nếu bạn muốn đặt cược vào khả năng ít ỏi mình sẽ trở thành người dùng thử Imagen thông qua AI Test Kitchen, bạn có thể truy cập vào đường liên kết sau: https://aitestkitchen.withgoogle.com/

Sau đó nhấn vào Register your interest để đăng ký trở thành người dùng thử nghiệm các công cụ AI mới của Google. 

Cách dùng thử Google Imagen AI

AI Test Kitchen là nơi Google thử nghiệm các dự án AI khác nhau trước khi chúng được phát hành ra công chúng. 

Cũng có lý do chính đáng cho việc Google hạn chế phát hành công khai các dự án AI. Mặc dù các mô hình chuyển văn bản thành hình ảnh chắc chắn có tiềm năng trong lĩnh vực sáng tạo, nhưng chúng cũng có một số lo ngại liên quan đến việc nó được sử dụng sai mục đích.

Kết luận riêng của Google là Imagen “không phù hợp để sử dụng công cộng tại thời điểm này”.

Tuy nhiên, câu hỏi được đặt ra là liệu Google có muốn đưa các mô hình AI này đến với công chúng rộng rãi hay không và nếu có thì hình thức đó sẽ như thế nào? Hiện tại, đối thủ OpenAI, đang gấp rút thương mại hóa các mô hình chuyển văn bản thành hình ảnh. Google có bao giờ cảm thấy hệ thống của mình đủ an toàn để đưa ra khỏi AI Test Kitchen và phục vụ người dùng không?

Như vậy, chúng ta đã tìm hiểu được Google Imagen AI là gì? Khả năng hiện tại của trình tạo hình ảnh từ văn bản của Google khi so với DALL-E ra sao và cách đăng ký trở thành người dùng thử nghiệm Imagen.

Nếu thấy bài viết này hữu ích, hãy LIKE & SHARE để ủng hộ GhienCongNghe tiếp tục phát triển và chia sẻ thêm nhiều nội dung liên quan khác có liên quan mà có thể bạn sẽ thắc mắc.