Nghệ An 24h

http://nghean24h.vn


Google đưa kỷ nguyên sáng tạo video bằng AI sang trang mới

Tại triển lãm thường niên Google I/O, Google đã công bố Veo 3 - trình tạo video AI kết hợp âm thanh, cùng với đó là Flow - công cụ thú vị dành cho những nhà sáng tạo…

 CEO Google Sundar Pichai phát biểu trên sân khấu Google I/O.

Theo CNBC, công cụ trí tuệ nhân tạo mới Veo 3 sẽ cạnh tranh trực diện với trình tạo video Sora của OpenAI, nhưng khả năng tự tạo âm thanh trong video là điểm nhấn khác biệt quan trọng. Đại gia Thung lũng Silicon cho biết Veo 3 có thể sáng tạo âm thanh bao gồm cả lời thoại nhân vật cũng như mô tả tiếng động vật.

Công cụ chính thức ra mắt với người dùng đăng ký gói thuê bao Ultra mới của Google với giá 250 USD/tháng. Veo 3 cũng được trang bị cho người dùng nền tảng doanh nghiệp Vertex AI của Google.

Màn ra mắt hoành tráng diễn ra khi hình ảnh và video trở thành trường hợp sử dụng phổ biến đối với công nghệ AI tạo sinh. Vào tháng 3 vừa qua, CEO OpenAI Sam Altman từng hé lộ trình tạo hình ảnh 4o của ChatGPT phổ biến đến mức khiến chip máy tính của công ty “tan chảy”. Công ty sau đó phải tạm thời hạn chế tính năng này.

Công cụ AI dành cho nhà sáng tạo

Nhưng đối với nhóm nhà sáng tạo nội dung, mối quan tâm thực sự nằm ở công cụ AI có tên Flow.

Flow là bước tiến mới nhất trong dự án video AI của Google, xây dựng dựa trên thử nghiệm VideoFX của Google Lab công bố tại sự kiện I/O năm ngoái.

Theo đó, Flow là chương trình riêng biệt với Imagen và Veo, nhưng có sử dụng hai mô hình này để thúc đẩy quá trình sáng tạo. Google đã trình diễn sản phẩm trong phần phát biểu quan trọng, cho thấy cách Flow được sử dụng để tạo clip video AI và ghép lại thành chuỗi dài hơn.

Người dùng có thể nhập lời nhắc văn bản và hình ảnh để tạo video AI hoặc tạo một số hình ảnh bằng Imagen. Flow cũng cung cấp nhiều tính năng chỉnh sửa cụ thể, như điều khiển máy ảnh cho phép điều chỉnh góc và chuyển động cảnh quay, hay tính năng xây dựng cảnh cho phép mở rộng clip đã thực hiện bằng AI trước đó.

Flow hiện được triển khai cho người dùng Hoa Kỳ thông qua ứng dụng Gemini đối với tài khoản đăng ký trả phí. Khách hàng có thể dùng thử phiên bản giới hạn với gói Google AI Pro (20 USD/tháng), cho phép tạo 100 video mỗi tháng. Tương tự Veo 3, nếu muốn trải nghiệm thêm nhiều tính năng Flow hơn, người dùng cần mua gói cao cấp mới nhất của Google, Ultra, với giá 250 USD/tháng.

Khi Google giới thiệu Flow, công ty nhấn mạnh đây là "công cụ được sinh ra dành cho những nhà sáng tạo". Một số nhà làm phim cũng chia sẻ cách sử dụng Flow trong quá trình làm phim, bao gồm nhiều tên tuổi lớn như Dave Clark, Henry Daubrez và Julie Lau.

Flow được coi là “cú twist” bất ngờ cho sự kiện Google I/O năm nay, cho thấy cách Google tiếp tục đầu tư vào phát triển mô hình sáng tạo bằng AI. Rất nhiều người chơi khác đang thể hiện quyết tâm trong lĩnh vực này - Adobe vừa trải qua “cuộc đại tu” về AI lớn nhất lịch sử, OpenAI công bố trình tạo hình ảnh gốc đầu tiên vào đầu năm và nhiều startup sáng tạo AI khác đều tìm cách gia nhập đường đua.

Flow chắc chắn có thể giúp Google tăng cường sự hiện diện trong ngành, nhưng cần thời gian để chứng minh hiệu quả. Theo quan điểm của một số chuyên gia, công cụ sẽ cần thêm nhiều tính năng độc đáo hơn nữa để xứng đáng với mức giá đắt đỏ.

Đặc biệt, vấn đề sáng tạo của AI tạo sinh luôn là chủ đề gây tranh cãi. Một trong những mối quan tâm lớn nhất của nhà sáng tạo là cách mô hình được đào tạo. Mặt khác, chính sách bảo mật Gemini của Google cho biết công ty có thể thu thập thông tin từ cuộc trò chuyện và tệp đính kèm từ người dùng.

Một số công nghệ AI khác được công bố

Ngoài ra, Google cũng công bố nhiều bản cập nhật AI khác tại sự kiện thường niên. Công ty tiết lộ đang hợp tác với HP về công nghệ hình ảnh mới có tên Project Starline. Gã khổng lồ công nghệ cũng mở rộng cách người dùng có thể tương tác với AI Overview trên Google Search với tính năng trợ giúp mua sắm. Gemini Live hiện hoàn toàn miễn phí cho người dùng Android và iOS. Tuần trước, Google vừa tổ chức sự kiện riêng tập trung vào hệ điều hành Android và ra mắt Material 3 Expressive, giao diện nhận dạng hình ảnh mới cho toàn bộ thiết bị Android.

Tác giả: Bảo Ngọc

Nguồn tin: vneconomy.vn