Mô hình AI chuyển văn bản thành hình ảnh của Google sắp ra mắt?

Mô hình AI chuyển văn bản thành hình ảnh của Google Imagen sẽ có buổi ra mắt công khai đầu tiên sắp tới đây, tuy nhiên ở điều kiện rất hạn chế.

Mô hình AI chuyển văn bản thành hình ảnh của Google sắp ra mắt?

Google phát triển công cụ AI chuyển văn bản thành hình ảnh của riêng mình

Google đang cực kỳ thận trọng với việc phát hành hệ thống AI chuyển văn bản thành hình ảnh của mình. Mặc dù mô hình Imagen của công ty tạo ra đầu ra có chất lượng ngang bằng với DALL-E 2 của OpenAI hoặc Stable Diffusion của AI Stability AI, Google vẫn không công khai rộng rãi hệ thống này với đông đảo người dùng.

Tuy nhiên, hôm nay, gã khổng lồ tìm kiếm đã thông báo rằng họ sẽ thêm Imagen - ở dạng rất hạn chế - vào ứng dụng AI Test Kitchen của mình như một cách để thu thập phản hồi sớm về công nghệ mới này.

Mô hình AI chuyển văn bản thành hình ảnh của Google sắp ra mắt?

Công cụ AI của Google

AI Test Kitchen đã được ra mắt vào đầu năm nay như một cách để Google thử nghiệm beta các hệ thống AI khác nhau. Hiện tại, ứng dụng cung cấp một số cách khác nhau để tương tác với mô hình văn bản LaMDA của Google và công ty sẽ sớm bổ sung các yêu cầu Imagen như một phần cập nhật cho ứng dụng. Tóm lại, sẽ có hai cách để tương tác với Imagen, mà Google đã giới thiệu: “City Dreamer” và “Wobble”.

Trong City Dreamer, người dùng có thể yêu cầu mô hình tạo các yếu tố từ một thành phố được thiết kế theo chủ đề mà họ lựa chọn - chẳng hạn như bí ngô, vải denim hoặc màu. Imagen tạo ra các tòa nhà và lô đất mẫu (quảng trường thị trấn, khu chung cư, sân bay, v.v.), với tất cả các thiết kế xuất hiện dưới dạng mô hình đẳng cấp tương tự như những gì bạn sẽ thấy trong SimCity.

Mô hình AI chuyển văn bản thành hình ảnh của Google sắp ra mắt?

Trong Wobble, bạn tạo ra một con quái vật nhỏ. Bạn có thể chọn chất làm nên con quái vật của mình, chẳng hạn như đất sét, nỉ, bánh hạnh nhân, cao su và sau đó cho nó mặc vào trang phục bạn chọn. Mô hình sẽ tạo ra con quái vật của bạn, đặt tên cho nó, và sau đó bạn có thể chọc và thúc đẩy điều đó để khiến nó “nhảy”. Đầu ra của mô hình bị hạn chế ở một thẩm mỹ rất cụ thể, trông giống như sự giao thoa giữa các thiết kế của Pixar cho Monsters, Inc. và tính năng tạo nhân vật trong Spore.

Những tương tác này rất hạn chế so với các mô hình chuyển văn bản thành hình ảnh khác và người dùng không thể yêu cầu bất cứ thứ gì họ muốn. Tuy nhiên, đó là chủ ý của Google. Như Josh Woodward, giám đốc cấp cao quản lý sản phẩm của Google, đã giải thích rằng mục đích của AI Test Kitchen là nhận được phản hồi từ công chúng về các hệ thống AI này và tìm hiểu thêm về cách mọi người sẽ phá vỡ chúng.

Mô hình AI chuyển văn bản thành hình ảnh của Google sắp ra mắt?

Google sẽ không chia sẻ bất kỳ dữ liệu nào về số người thực sự đang sử dụng AI Test Kitchen nhưng cho biết phản hồi mà họ nhận được là vô giá. Tuy nhiên, câu hỏi lớn đặt ra là liệu Google có muốn giới thiệu những mô hình này đến với công chúng rộng rãi hơn không và nếu có, thì hình thức đó sẽ như thế nào? Các đối thủ của công ty, OpenAI và Stability AI, đang gấp rút thương mại hóa các mô hình chuyển văn bản thành hình ảnh. Liệu Google có bao giờ cảm thấy hệ thống của mình đủ an toàn để đưa ra khỏi AI Test Kitchen và phục vụ tối đa người dùng không?

Bạn nghĩ sao về việc thử nghiệm công cụ mới này từ Google? Hãy chia sẻ ý kiến bên dưới bài viết.

Theo dõi Phúc Anh để cập nhật những thông tin thú vị.

Tin liên quan

Hotline facebook-chat1.png zalo chat
So sánh (0)

SO SÁNH SẢN PHẨM

Thêm sản phẩm

So sánh
Xoá sản phẩm