Trong bối cảnh công nghệ AI ngày càng phát triển, việc sử dụng các chatbot hỗ trợ lập trình hay xử lý văn bản đã trở nên phổ biến. Mặc dù AI có thể giúp bạn tạo ra các đoạn mã hiệu quả hoặc bản nháp tài liệu ban đầu, việc kiểm tra và tinh chỉnh những nội dung này luôn là một thách thức. Nhận thấy nhu cầu đó, Google Gemini vừa được bổ sung hai tính năng mạnh mẽ: Canvas – không gian làm việc tương tác, và Audio Overviews – khả năng tóm tắt nội dung dưới dạng âm thanh, hứa hẹn thay đổi cách chúng ta tương tác với trí tuệ nhân tạo.
Gemini Canvas: Không Gian Làm Việc Tương Tác Đa Năng
Gemini Canvas là một không gian làm việc tương tác mới, được tích hợp trực tiếp trong giao diện chatbot Gemini. Nó xuất hiện dưới dạng một cửa sổ có thể chỉnh sửa ngay bên cạnh cuộc trò chuyện, nơi Gemini sẽ hiển thị đầu ra văn bản hoặc mã nguồn của mình. Tính năng này mang đến vô số tùy chọn chỉnh sửa, giúp người dùng dễ dàng tinh chỉnh nội dung do AI tạo ra.
Tối Ưu Hóa Văn Bản Với Gemini Canvas
Với Canvas, bạn có thể yêu cầu Gemini tạo một bản nháp tài liệu ban đầu, hoặc cung cấp cho AI phần văn bản bạn đã viết để nó hỗ trợ chỉnh sửa. Gemini có khả năng phân tích các đoạn văn bản được đánh dấu và đưa ra các gợi ý hữu ích, bao gồm điều chỉnh giọng điệu (làm cho văn bản súc tích, chuyên nghiệp hơn hoặc thân mật hơn), điều chỉnh độ dài, hoặc thay đổi định dạng. Vì mọi thứ đều được xuất ra một cửa sổ có thể chỉnh sửa, việc sửa lỗi do AI tạo ra trở nên cực kỳ đơn giản – bạn có thể tự mình viết lại hoặc đánh dấu những phần đó để AI sửa chữa. Khi có một tài liệu hoàn chỉnh, bạn có thể dễ dàng xuất nó sang Google Docs.
Giao diện Gemini Canvas hiển thị chế độ xem tài liệu tương tác
Kiểm Thử và Chỉnh Sửa Mã Nguồn Trực Tiếp Trên Canvas
Canvas không chỉ cung cấp cửa sổ chỉnh sửa cho văn bản mà còn cho cả mã nguồn. Điểm nổi bật là nó có một tab “Preview” (Xem trước) cho phép bạn chạy và kiểm tra xem mã nguồn đó có hoạt động không. Mã của bạn có thể được chạy trực tiếp trên tab Preview để xem cách nó xuất hiện và hoạt động trong bối cảnh thực tế mà không cần triển khai hay sử dụng một môi trường phát triển tích hợp (IDE) riêng biệt. Ví dụ, người dùng có thể yêu cầu Gemini tạo mã HTML cho một biểu mẫu đăng ký email và ngay lập tức xem trước giao diện của nó. Những thay đổi tiếp theo, như thêm trường nhập liệu hoặc nút kêu gọi hành động, cũng có thể được yêu cầu và xem trước theo thời gian thực.
Trong thực tế, AI đôi khi có thể tạo ra mã nguồn không hoàn hảo. Ví dụ, khi yêu cầu Gemini tạo các trò chơi HTML/JavaScript đơn giản, mã được tạo ra có thể trông mạch lạc nhưng lại gặp lỗi (như một trò chơi platformer kiểu Super Mario Bros mà nhân vật không thể nhảy). Điều tuyệt vời ở Canvas là bạn có thể kiểm tra xem các phần mã của mình có bị lỗi hay không và nhanh chóng khắc phục nếu cần, bằng cách tự debug hoặc yêu cầu AI giúp gỡ lỗi bằng cách đánh dấu các phần mã cụ thể. Ở phiên bản xem trước ban đầu, Canvas hỗ trợ HTML, CSS, JavaScript và React, và Google cho biết nó sẽ tương thích với hầu hết các ngôn ngữ lập trình mà Gemini có thể xử lý, bao gồm cả Python.
Hạn Chế và Lộ Trình Phát Triển Của Canvas
Tại thời điểm ra mắt, Canvas sẽ chỉ có sẵn trên máy tính để bàn, nhưng Google cho biết trải nghiệm di động sẽ được triển khai vào cuối tháng này. Hiện tại, tính năng này chỉ khả dụng cho mô hình Gemini 2.0 Flash, dù Google khẳng định nó sẽ có mặt trên tất cả các mô hình khác, bao gồm cả Thinking và Deep Research models trong tương lai, mặc dù chưa có khung thời gian cụ thể.
Audio Overviews: Tóm Tắt Thông Tin Qua Kênh Âm Thanh Độc Đáo
Bên cạnh Canvas, Google còn giới thiệu “Audio Overviews” – một tính năng ban đầu xuất hiện trong NotebookLM và giờ đây đã có mặt trên Gemini. Audio Overviews hoạt động bằng cách tạo ra một cuộc thảo luận ảo giữa hai “host” AI. Các host này sẽ phân tích các tệp đã tải lên như tài liệu, slide thuyết trình, hoặc thậm chí là các báo cáo Deep Research, sau đó tham gia vào cuộc trò chuyện về nội dung đó. Họ tóm tắt các điểm chính, kết nối giữa các chủ đề khác nhau và đưa ra những góc nhìn độc đáo.
Mặc dù có vẻ là một ý tưởng khá mới lạ, nhưng nhiều người thích nghe podcast và học hỏi hiệu quả qua hình thức này. Audio Overviews cố gắng mang khái niệm tương tự vào việc học tập nói chung. Bạn có thể cấp cho nó ghi chú bài học, tài liệu nghiên cứu, chuỗi email dài hoặc các báo cáo và nhận được một phiên bản âm thanh tóm tắt mà bạn có thể nghe khi đang di chuyển. Miễn là nó tiêu hóa nội dung đúng cách (luôn cần kiểm tra lại mọi thứ AI cung cấp vì đôi khi nó có thể “ảo giác”), đây là một công cụ khá tuyệt vời cho việc học tập và nghiên cứu.
Thời Điểm Triển Khai Và Khả Năng Tiếp Cận
Cả hai tính năng Gemini Canvas và Audio Overviews đang được triển khai bắt đầu từ hôm nay, áp dụng cho cả người dùng miễn phí và trả phí. Canvas sẽ có sẵn cho người dùng ở tất cả các ngôn ngữ, trong khi Audio Overviews ban đầu chỉ khả dụng bằng tiếng Anh.
Những cải tiến này cho thấy Google đang không ngừng nỗ lực để biến Gemini thành một trợ lý AI mạnh mẽ và toàn diện hơn, đặc biệt hữu ích cho các tác vụ liên quan đến lập trình, soạn thảo và nghiên cứu. Với Canvas và Audio Overviews, Gemini không chỉ là một công cụ tạo nội dung mà còn là một không gian làm việc thông minh, giúp người dùng tối ưu hóa quy trình làm việc và học tập một cách hiệu quả. Hãy trải nghiệm và khám phá những tiện ích mà các tính năng mới này mang lại cho bạn!
Tài liệu tham khảo: Google Blog