Cảnh tượng đó hôm nay không còn quá xa lạ, khi có sự phát triển của Internet của vạn vật (IoT) và trí tuệ nhân tạo (AI). Và nó không diễn ra đâu xa xôi trên thế giới, ở Việt Nam, tại một Trường ĐH Công nghệ Thông tin ĐHQG TP.HCM, chàng giảng viên 9X Nguyễn Việt Quốc cùng cộng sự là những sinh viên của mình đã tạo ra một “cô thư ký ảo” mang tên ứng dụng Umind có thể nghe, hiểu và thực hiện những yêu cầu của “chủ nhân”.
Chỉ cần ra lệnh với chiếc điện thoại
Ý tưởng về một “thư ký ảo” bắt đầu từ hơn 5 năm trước, khi Nguyễn Việt Quốc còn là sinh viên Trường ĐH Công nghệ Thông tin. “Thấy nhiều người già, người khuyết tật gặp nhiều khó khăn trong việc điều khiển các thiết bị công nghệ hiện đại, rồi những tài xế sử dụng điện thoại khi lái xe rất nguy hiểm, mình nghĩ giá như chỉ cần nói với chiếc điện thoại rồi nó làm hết thì hay quá” - Việt Quốc chia sẻ.
Umind thường được gọi là “cô thư ký ảo”, cụm từ để chỉ tính năng của phần mềm điều khiển bằng giọng nói. Người dùng chỉ cần nói và phần mềm sẽ tự xử lý mà không cần tương tác với thiết bị bằng tay. Từ đó giúp con người đỡ vất vả trong việc nhà, và nâng cao chất lượng cuộc sống.
Umind có những tiện ích gì? Có khá nhiều điều mà Umind có thể làm thay con người, từ đặt báo thức, chỉ đường, sắp xếp lịch trình làm việc, dạy nấu ăn… Ví dụ như bạn đặt câu hỏi: “Umind, bây giờ là mấy giờ” thì sẽ nhận được câu trả lời chính xác “Bây giờ chính xác là 14 giờ 30 phút”. Hay bạn ra lệnh “Umind gọi tôi dậy lúc 5 giờ” thì sẽ được trả lời “Đã đặt báo thức lúc 5 giờ”. Hoặc buổi sáng, muốn mở một bản nhạc mà làm biếng quá bạn có thể “nhờ” Umind làm hộ bằng lệnh “Hãy mở bài hát Lạc trôi” thì Umind sẽ thực hiện và trả lời “Đã mở bài hát Lạc trôi”, sau đó là tiếng nhạc vang lên…
“Nếu như bạn có một lịch làm việc dày đặc thì không cần thuê một cô thư ký sắp xếp và thông báo cho mình nữa mà chỉ cần ra lệnh và Umind tự động thông báo đầy đủ và chính xác ngày, giờ, sự kiện diễn ra” - Hồ Nguyễn Anh Phong, thành viên của nhóm cho biết thêm.
Bên cạnh những tiện ích trên thì tính năng mà nhóm tâm đắc nhất đó chính là Umind có thể kết nối với nhiều thiết bị điện khác ở trong nhà. “Hãy tưởng tượng, khi bạn đi ngủ nhưng quên tắt đèn, hay bước ra khỏi nhà, khóa cửa rồi nhưng nhớ ra chưa tắt máy điều hòa. Lúc này vẫn chỉ cần một câu nói Umind sẽ làm giúp bạn” - Việt Quốc tâm đắc.
Nhóm sinh viên tạo ra Umind. Ảnh: NVCC |
Sản phẩm dành riêng cho người Việt
Mất 5 năm nghiên cứu, và thêm 5 tháng để hoàn thiện sản phẩm đưa ra thị trường, khoảng thời gian đó nhóm gặp rất nhiều khó khăn. “Phần mềm “thư ký ảo” không phải là mới, hiện nay trên thị trường có khá nhiều loại, tuy nhiên cái mình hướng đến là một sản phẩm dành riêng cho người Việt, có thể nghe, hiểu, thực hiện mệnh lệnh bằng tiếng Việt” - Việt Quốc tâm sự.
Và cũng xuất phát từ ý tưởng phải là sản phẩm “riêng, duy nhất” cho người Việt, mà nhóm đã dành nhiều thời gian để cho ra một sản phẩm Umind với nhiều ưu điểm vượt trội.
Umind gồm có 3 phần, hoạt động theo quy trình nhận giọng nói, chuyển giọng nói sang văn bản, xử lý ngôn ngữ tự nhiên và cuối cùng là chuyển văn bản sang giọng nói. Trong đó, phần khó nhất là xử lý ngôn ngữ tự nhiên, để phần mềm hiểu và thực hiện câu lệnh bằng tiếng Việt hoàn toàn không đơn giản. “Người với người trò chuyện với nhau mà nhiều khi còn không hiểu nữa là một phần mềm” - Anh Phong chia sẻ.
Máy móc vẫn là máy móc và không thể hơn con người. Có nhiều câu chuyện cười ra nước mắt với Umind. Như Việt Quốc kể lại rằng, có một cộng sự ra lệnh cho Umind nhắn tin “anh yêu em nhiều” đến vợ. Nhưng tin nhắn lại được gửi đến… em vợ. Lý do đơn giản là khi Umind nghe lệnh thì sẽ tìm trong danh bạ và theo nguyên tắc chọn cái tên đầu tiên thấy để gửi, mà trong bảng chữ cái Việt Nam “em vợ” luôn đứng trước “vợ”.
Và “cái khó ló cái khôn”, vì dữ liệu về xử lý ngôn ngữ tiếng Việt khá ít nên nhóm đã nảy ra ý tưởng nghiên cứu ứng dụng Deep learning. Đây là một một ý tưởng được đánh giá rất cao, bởi nhờ có Deep learning mà Umind có thể “học” từ chính chủ nhân của mình.
Cụ thể, với một định nghĩa chưa có trong cơ sở dữ liệu thì Umind sẽ ghi nhớ cho những lần trả lời sau. Người dùng có thể “dạy” Umind, và dần dần Umind trở thành một “cô thư ký” biết việc, tiến bộ hơn rất nhiều. Thêm một điều hay là nhóm đã nghiên cứu, tìm ra phương pháp để Umind có thể phân biệt điều đã học và không học lại nữa. Và như một người trò ngoan, học hết cả tính tốt lẫn xấu của thầy. Ví dụ thầy hài hước, nói nhẹ nhàng thì Umind cũng thế, còn thầy nhát gừng thì nhận lại cọc cằn.
Hiện Umind đang được Việt Quốc và các cộng sự sử dụng thử nghiệm trong một cộng đồng nhỏ để hoàn thiện, sau đó mới đưa ra thị trường. Hiện tại Umind đang có những tính năng cơ bản nhất như chỉ đường, mở nhạc, gọi điện, báo thức, đọc báo, tắt mở đèn…
Trong tương lai xa hơn, Umind hướng sẽ như một “cô trợ lý ảo có ba đầu sáu tay” có thể thực hiện nhiều công việc khác nhau. Hiện tại, Việt Quốc cho biết đang mong Umind sẽ phục vụ tốt người dùng, sau đó mới tính đến chuyện xây dựng mô hình kinh doanh quanh sản phẩm này.
Có thể đăng ký tải ứng dụng Umind tại http://umind.io/