Tanigo Blog xin chia sẻ đến độc giả một góc nhìn vô cùng thú vị về AI qua bài viết sau. Hy vọng bài viết sẽ cung cấp cho các bạn cái nhìn tổng quan nhất về AI trong năm qua và các xu hướng cho năm 2024!
Nhìn lại năm 2023
Năm 2023 là sự khởi đầu bùng nổ của AI, hay phải nói đúng hơn là sự bùng nổ của ứng dụng AI đầu tiên đi thành công vào cuộc sống – ChatGPT
ChatGPT – AI Chatbot thành công nhất hiện tại
AI đã tồn tại hàng chục năm nay nhưng ứng dụng của nó hầu như chỉ trong phòng thí nghiệm, hoặc ẩn mình sau những tính năng mà các hãng công nghệ hay dùng bằng các từ “smart” hay “intelligent”. AI bản thân nó chưa bao giờ tự đứng một mình thành công như một ứng dụng độc lập. Thế nhưng ChatGPT lại chính là sản phẩm đầu tiên mà AI đứng như một ứng dụng độc lập. Mô tả chính xác cho ChatGPT phải là “một ứng dụng Chatbot có sử dụng AI”.
ChatGPT làm mê hoặc mọi người bởi sự “dễ dùng” và “sự thông minh đáng kinh ngạc”, khiến định nghĩa AI trở thành tương đương với ChatGPT. Nói về AI, thứ đầu tiên hiện ra trong đầu người dùng chính là Chatbot ChatGPT. Điều này thực sự vừa hay lại vừa dở, hay khi khái niệm AI rất trừu tượng, không có hình dạng cụ thể nay đã có hình dạng là “một con chatbot, một khung chat siêu thông minh, hỏi gì cũng đáp được”, dở là khi khái niệm này sẽ đóng khung hiểu biết và cảm nhận của người dùng về AI, tạo ra một lối mòn mong chờ về AI, chúng ta sẽ tiếp tục mong chờ về các ứng dụng AI khác nhưng chỉ là dưới dạng Chatbot. Những người làm sản phẩm AI hay những hãng công nghệ đang tìm cách ứng dụng AI phần lớn cũng sẽ rơi vào cái bẫy nhận thức “AI – Chatbot” này, dẫn tới quanh quẩn tìm cách ứng dụng AI trong thực tế quanh khái niệm lối mòn đã hình thành này.
2024 và những xu hướng ứng dụng thực tế AI trong cuộc sống
Năm 2024 sẽ là năm bùng nổ về AI Ứng Dụng, là năm thành công của “ứng dụng tiên phong”. ChatGPT của 2023 đã cuốn tất cả các tập đoàn công nghệ lớn phải đầu tư hàng chục tỉ đô la vào nền tảng AI, cuốn theo luôn hàng trăm công ty công nghệ lớn khác phải chạy theo ứng dụng công nghệ AI vì người dùng đã phát sinh nhu cầu “sử dụng AI”. Với tất cả số tiền khổng lồ đã đốt cho AI nền tảng, thì giờ họ phải kiếm tiền từ những Ứng Dụng AI – những Sản phẩm Ứng Dụng AI thực tế mà người dùng sẽ chi tiền để mua và sử dụng, theo đúng tinh thần của chủ nghĩa tư bản – đầu tư phải mang lại lợi nhuận.
Thế nhưng như đã nói ở trên, cái lối mòn nhận thức “AI – Chatbot” mà ChatGPT tạo ra vừa lợi lại vừa hại, tất cả các sản phẩm ứng dụng AI hiện tại và xu hướng của những sản phẩm AI của năm nay đều quay quanh AI Chatbot, tất cả đều vẫn là các “khung chat có AI” hay xịn xò hơn thì là “mấy cái loa phát tiếng nói có AI – voice Assistant” vốn đã có từ 2010 – lúc Apple Siri ra đời.
Tệ hơn thì là đám “AI giả cầy”, tức là đám tính năng mà các hãng trước đây vẫn hay gọi bằng mấy cái tên như “Smart”, “Intelligent”, “Thông minh”. Những tính năng này vốn không chứa hàm lượng “AI” nhiều lắm, chúng phần lớn là các chương trình được lập trình sẵn với những kết quả được định sẵn, ví dụ: cái máy giặt có tính năng tự cân trọng lượng đồ giặt và tính toán ra lượng nước, lượng bột giặt, thời gian giặt thích hợp, trước đây tính năng này được quảng cáo với cái tên có chữ “Smart” thì ngày nay các hãng lại đổi thành “AI” dù bản chất chẳng khác gì. Xu hướng này đơn giản sẽ là ngắn hạn khi các hãng công nghệ chưa thể làm ra được những thứ có hàm lượng “AI” cao hơn.
Đối với xu hướng chính “AI Chatbot – Assistant” thì hiện các đại tập đoàn công nghệ vẫn đang loay hoay với các sản phẩm ứng dụng AI dạng này. Chúng ta sẽ đi qua vài Ứng dụng AI điển hình và bàn về xu hướng phát triển tiếp theo của Ứng dụng AI ấy.
(Hình ảnh minh hoạ được thêm bởi Tanika Blog)
Ông vua Ứng dụng Chatbot AI vẫn chưa bị lật đổ, vẫn là ứng dụng AI phổ dụng nhất, được dùng nhiều nhất và vẫn “hữu dụng” nhất. Nói ChatGPT “hữu dụng nhất” là vì ChatGPT vẫn đang liên tục được cải thiện, bổ sung các tính năng mới rất đột phá, giúp ChatGPT tiếp tục là một trong các ứng dụng AI thật sự rất có ích. OpenAI ChatGPT vẫn đang là người dẫn đầu các xu hướng AI Ứng Dụng mới thông qua các tính năng mới của họ:
- ChatGPT Code Interpreter (nay đổi tên thành ChatGPT Data Analysis – một sự đổi tên khó hiểu của OpenAI): đây là một tính năng rất đột phá mang tính định hướng cho AI ứng dụng, mà phải nói rằng chỉ những người rất có hiểu biết và tầm nhìn ứng dụng về AI mới nghĩ ra. Vì AI vốn rất giỏi trong việc viết và cực kì kém trong tính toán, AI kém trong mọi loại tính toán từ cộng trừ nhân chia cho tới suy luận logic, bạn đừng nghĩ là hỏi AI 1+1 và nó trả lời là 2 thì là nó biết tính toán, đơn giản là nó đã được đọc đâu đó trên internet có phép toán 1+1 là bằng 2 nên nó đơn giản là trả lời dựa trên thứ nó đã được học. Các thử nghiệm đã chứng minh ChatGPT 3.5 (bản AI không có Code Interpreter) làm sai 100% các phép toán có từ 6 chữ số trở lên, lí do là trên Internet sẽ không có kết quả cho mọi phép toán 2 số có 6 chữ số. Làm toán là quá trình tạo ra thứ vốn không có trước đó, rất khác so với viết văn là quá trình trình diễn thông tin vốn đã có trước đó, làm toán chính là dạng thức tư duy trừu tượng nhất của con người. AI làm được toán (hiểu toán và làm được toán thực sự) là mục tiêu của các nhà khoa học trên con đường tạo ra Trí tuệ nhân tạo toàn năng (AGI) dạng AI có thể tự tư duy trừu tượng như con người, thậm chí cách đây vài tháng tại OpenAI đã xảy ra một cuộc đảo chính (bất thành) của các nhà khoa học sau khi có bằng chứng là họ đã tạo ra được AI có khả năng hiểu toán và làm toán như học sinh cấp 3, khiến các nhà khoa học hoảng loạn và muốn ngăn chặn tốc độ phát triển của AI biết làm toán.
Nói dài dòng là để giải thích cốt lõi của tính năng ChatGPT Code Interpreter này và tại sao nó quan trọng với tương lai phát triển AI Ứng Dụng trong ngắn hạn. Tính năng này lợi dụng khả năng viết văn và viết code xuất sắc của AI để hỗ trợ cho sự yếu kém trong khả năng làm toán và tư duy logic của AI. Ý tưởng của tính năng này rất đơn giản, AI sẽ dựa trên câu hỏi của người dùng, nếu câu hỏi đó đòi hỏi tư duy logic hoặc tính toán, ví dụ bạn hỏi AI rằng nếu tôi có mảnh vườn 678968 m2, tôi muốn chia cho 6958 người thì mỗi người có bao nhiêu m2 đất, AI sẽ viết một đoạn code – hay gọi là lập trình – một chương trình hẳn hoi chạy được (thường là bằng ngôn ngữ lập trình Python) để làm phép toán 678968 / 6958 rồi thực hiện chạy chương trình đó luôn để lấy kết quả tính toán rồi trả lời cho người dùng. Đây là một cách giải vấn đề rất thông minh, AI sẽ tư duy logic thông qua lập trình, dùng việc viết chương trình – thứ mà nó đã được học từ hàng tỉ dòng mã nguồn các loại chương trình trên internet – để giải mọi vấn đề logic hóc búa; mở ra cho AI khả năng tư duy, giải quyết vấn đề gần với con người hơn rất nhiều.
- ChatGPT Function Call: đây là một tính năng mà nhiều bên khác đang tìm cách bắt chước nhưng vẫn chưa thành. OpenAI dạy cho AI khả năng viết code và sử dụng các công cụ thông qua việc truy vấn các API (giao diện lập trình ứng dụng) có sẵn. Hiểu nôm na là tính năng này cho phép AI không còn chỉ hỏi và đáp nữa mà còn có thể tương tác, sử dụng các công cụ khác, ví dụ như hiện giờ AI có thể Search (ChatGPT dùng Bing thay vì Google để search), đọc file, truy cập website, truy cập các cơ sở dữ liệu, etc. Đây là tính năng mở khả năng cho AI trở thành các Trợ Lý (Assistant) thực thụ, giúp con người được vô vàn công việc thay cho các Assistant truyền thống như Apple Siri, Google Assistant, Amazon Alexa,…
- Multi-modal: Nhiều giác quan khác cho con AI, nhiều con AI trong một con AI. ChatGPT 4 hiện nay là con AI chứa nhiều con AI khác bên trong, mỗi con AI đảm nhiệm một nhiệm vụ, con AI nghe được – diễn giải âm thanh thành văn bản, con AI nhìn được – diễn giải hình ảnh nó nhận được thành văn bản, con AI làm toán được, con AI vẽ tranh tạo ảnh được, etc . Đây là tính năng mà nhiều bên làm AI khác bắt đầu triển khai
- GPTs: AI Agent – Nhân viên AI – đây là tính năng mà OpenAI đưa ra cho ChatGPT, cho phép người dùng tự phối hợp các tính năng đã nói ở trên cùng với dữ liệu riêng mà người dùng cung cấp, để tạo ra các con AI có thể làm những công việc chuyên biệt, ví dụ: con AI chuyên dạy trẻ con làm toán, con AI chuyên phân tích báo cáo tài chính doanh nghiệp, con AI chuyên tóm tắt nội dung video, etc. Tính năng này của OpenAI ChatGPT đã khởi đầu một xu hướng rất lớn mà rất nhiều công ty startup AI mới mọc ra đang nhắm tới miếng bánh thị trường trị giá hàng trăm tỉ đô này.
(Hình ảnh minh hoạ được thêm bởi Tanika Blog)
Microsoft hiện đang là đại gia bao nuôi cho OpenAI và bản thân của ứng dụng ChatGPT đình đám, Microsoft cung cấp toàn bộ hạ tầng máy chủ, phần cứng để chạy ChatGPT và các ứng dụng liên quan ChatGPT. Do đó các tính năng đột phá mà OpenAI phát triển cho ChatGPT thì Microsoft cũng đồng thời sở hữu và tích hợp vào các sản phẩm của đại gia công nghệ này. Điều này dẫn tới việc Microsoft tạo ra Microsoft Copilot.
Microsoft Copilot có thể coi là phiên bản ChatGPT được tích hợp vào toàn bộ dải sản phẩm có sẵn của Microsoft đang cung cấp, mà Microsoft thì đang cung cấp phần mềm chống lưng cho mọi doanh nghiệp đang có trên thế giới, từ hệ điều hành Windows, tới bộ Microsoft Office, tới bộ công cụ lập trình Microsoft Visual Studio, trình duyệt EDGE, công cụ tìm kiếm Bing, hạ tầng máy chủ đám mây Azure,…, tất tần tật Microsoft đều gắn ChatGPT vào và nâng cấp chúng ngay lập tức lên thành Ứng Dụng Có AI Hỗ Trợ. Dĩ nhiên tầm nhìn của Microsoft là vậy, còn thực tế triển khai thì Microsoft Copilot phiên bản thử nghiệm hiện tại không khác ChatGPT là mấy, chỉ đơn giản là một cái khung chat gắn vào tất cả các sản phẩm đã có của Microsoft, vẫn chưa tự động điều khiển các ứng dụng phần mềm của Microsoft như trong mấy video demo mà hãng công bố (ví dụ: kêu AI tự tính toán lương nhân sự của công ty tháng này là nó tự mở Excel tự tính, không cần kế toán nữa). MS nổi tiếng với việc tạo ra những bản demo tuyệt vời, nhưng sản phẩm thì có lẽ sẽ phải chờ đợi rất lâu nữa.
(Hình ảnh minh hoạ được thêm bởi Tanika Blog)
Google vốn là tập đoàn dẫn đầu về AI cả chục năm nay, thực ra hãng đã tạo ra AI và tích hợp AI vào tất cả các sản phẩm của hãng từ rất lâu, hãng cũng là nhà cung cấp dịch vụ AI Đám Mây (Cloud AI Service) từ tận 2015, các sản phẩm từ Google Search, Google Translate, Google Maps dẫn đường, Android OS,… đều đã dày đặc các tính năng AI từ gần chục năm nay. Nhưng Google chưa bao giờ có một Ứng Dụng AI Riêng Lẻ nào hết, chưa bao giờ, nên nếu nói Google thua trong cuộc đua AI thì họ thua trong việc tạo ra AI Ứng Dụng.
Sau thành công của ChatGPT, sản phẩm AI Ứng Dụng trực tiếp đe dọa tới Google Search, sản phẩm cốt lõi của tập đoàn Google, ngay từ khi có ChatGPT, người ta bắt đầu lười gõ vào khung tìm kiếm của Google rồi, thay vào đó người ta hỏi ChatGPT hay hỏi Microsoft Copilot để nhận được thông tin nhanh chóng thay vì phải lướt qua hàng chục kết quả tìm kiếm từ Google. Google thực sự bị buộc phải tất tay vào cuộc đua làm AI Ứng Dụng, vì sự sống còn của tập đoàn Google.
Sản phẩm AI Ứng Dụng đầu tiên của Google là Google Bard, một sản phẩm Google phải làm rất vội vã trong 100 ngày, huy động toàn bộ các nhà khoa học AI hàng đầu của Google bao gồm cả nhà khoa học tiên phong sáng lập nên Google là Sergey Brin.
Nhưng sản phẩm AI Ứng Dụng đầu tiên của Google – Google Bard này thực sự là tệ, tệ ngay trong tính năng cơ bản là chat hỏi và đáp, câu trả lời từ AI Bard rất kém chất lượng. Google phải dồn sức để gấp rút huấn luyện con AI đằng sau ứng dụng Google Bard, là con AI Google Gemini, đây là con AI mà Google kỳ vọng đấu ngang cơ với con AI GPT-3.5 và GPT-4 đằng sau ứng dụng ChatGPT. Cuối tháng 12.2023 vừa rồi, Google đã release được con AI Gemini, kết quả là con Google Bard đã khá hơn rất nhiều trong việc hỏi đáp, nhưng đáng tiếc là chỉ có vậy. Google vẫn chưa đuổi kịp OpenAI và Microsoft ở các tính năng AI cách mạng như: Code Interpreter, Function Call, Multi-Modal, AI Agent. Google Bard hiện thiếu các khả năng truy cập hay tương tác với các hệ thống khác, trong khi Google với hệ sinh thái ứng dụng rộng lớn không thua gì Microsoft, đây thực sự là điều đáng tiếc. Chúng ta hãy cùng chờ tiếp xem Google sẽ cải thiện như thế nào ở đầu năm 2024 này vì họ hứa rằng sẽ cung cấp AI Gemini phiên bản Ultra có năng lực tương đương với GPT-4 của OpenAI & Microsoft.
(Hình ảnh minh hoạ được thêm bởi Tanika Blog)
Đây là một sản phẩm AI Ứng Dụng, mình nghĩ cũng cần đề cập vì đây vẫn là một AI Ứng Dụng thành công, và thành công của nó vẫn thuộc xu hướng “AI Chatbot – Assistant”. Đây là Ứng Dụng AI Tạo Ảnh, một xu hướng AI khác bên cạnh AI Chatbot của ChatGPT, thế nhưng con AI tạo ảnh này thực tế vẫn là AI Chatbot, chỉ là giao diện ứng dụng chat của nó không phải là một ứng dụng riêng lẻ mà được tích hợp bên trong ứng dụng chat đã có sẵn là Discord. Thông qua Discord, người dùng chat với con AI Chatbot Midjourney yêu cầu Tạo Ảnh của mình, và con AI này trả lại kết quả là hình ảnh được AI tạo ra. Chính giao diện Chat đã giúp Midjourney dễ dùng dễ tiếp cận với người dùng, qua đó tạo ra một AI Ứng Dụng độc đáo, một mô hình kinh doanh độc đáo thành công. Hiện tại, Midjourney là Ứng Dụng AI đầu tiên có lãi.
(Hình ảnh minh hoạ được thêm bởi Tanika Blog)
Đây cũng là một sản phẩm AI Ứng Dụng đã có từ trước ChatGPT, sử dụng mô hình AI GPT-3 tiền thân của ChatGPT, đây là sản phẩm AI khá chuyên biệt, tập trung hỗ trợ các lập trình viên trong việc lập trình. Tuy nhiên sản phẩm này cũng không hề phổ dụng cho đến khi xu hướng “AI Chatbot – Assistant” hình hành. Sau khi ChatGPT ra đời, Microsoft tích hợp khung chat AI của ChatGPT vào sản phẩm này và gắn lên công cụ lập trình Visual Studio Code thì sản phẩm này mới thực sự bùng nổ và giúp các lập trình viên tăng hiệu suất thông qua việc chat với AI và nhờ nó viết code.
.
Xu hướng AI Ứng Dụng 2024
Thông qua 4 sản phẩm AI Ứng Dụng Thực Tế điển hình ở trên, chúng ta có thể thấy xu hướng AI Ứng Dụng của năm 2024 đã hình thành, cơ bản nếu không có một startup nào có ý tưởng đột phá như cách ChatGPT đã làm thì các xu hướng này sẽ không bị phá vỡ mà vẫn tiếp tục xuyên suốt năm 2024 này:
- AI Chatbot sẽ vẫn là giao diện người dùng cuối (User Interface) chủ đạo, khung chat sẽ xuất hiện mọi nơi, mọi ứng dụng truyền thống muốn có AI sẽ đơn giản là tích hợp một khung chat vào, các startup AI mới cũng sẽ làm sản phẩm xoay quanh khung chat này.
- Về tính năng của các Ứng Dụng AI tựu chung sẽ tận dụng các tính năng đột phá mà OpenAI đã đưa ra ở nửa cuối năm 2023 như đã đề cập ở trên – Code Interpreter, Function Call, Multi-Modal để tiến tới việc tạo ra các Ứng Dụng AI Chuyên Biệt mà thuật ngữ ngành AI chúng tôi gọi là các AI Agent – mình đề xuất dịch là Nhân Viên AI – các Nhân Viên AI này sẽ được huấn luyện để trở thành chuyên gia trong một lĩnh vực cụ thể, có thể thực hiện các công việc thay cho con người chứ không chỉ dừng lại ở việc hỏi đáp. Ví dụ các Nhân Viên AI có thể là
- Chuyên Gia Phân Tích Số Liệu Kinh Doanh: bạn đưa cho Nhân Viên AI này một vài file excel hoặc word chứa các số liệu, tài liệu kinh doanh, nó sẽ tự động đọc tài liệu, phân tích dữ liệu trong các file mà bạn đưa, rồi tự tạo các báo cáo vẽ các biểu đồ dựa trên các thông tin mà nó phân tích được.
- Nhân Viên AI Thư Ký: quản lý tài liệu, hồ sơ, thông tin lịch hẹn, lịch họp, lịch trình công việc của cả tổ chức doanh nghiệp, thu thập quản lý các nội dung họp của cả tổ chức, khi cần bất kỳ ai trong doanh nghiệp cũng có thể hỏi thư ký này truy lục thông tin, hoặc có thể yêu cầu các nghiệp vụ thư ký khác như sắp xếp lịch họp, book phòng họp, viết thư mời, tổ chức họp, chuẩn bị tài liệu họp, etc
- Nhân Viên Sale AI: tự động tham gia các cuộc thảo luận trên mạng, tự lọc ra các khách hàng tiềm năng, chủ động liên lạc chào mời sản phẩm dịch vụ, giải đáp các thắc mắc của khách hàng về sản phẩm dịch vụ, kết nối khách hàng tiềm năng với nhân viên sale con người, etc. AI Agent hiện có thể thực hiện 5 / 7 bước bán hàng tiêu chuẩn.
- Nhân Viên Designer AI: tự động tìm kiếm hình ảnh từ internet, thiết kế hình ảnh marketing, tạo các hình ảnh, video sản phẩm theo yêu cầu, không giới hạn tùy chọn, làm việc 24/7.
- Ứng Dụng AI sẽ kết hợp với Tự Động Hóa: một xu hướng AI Ứng Dụng khác đang nổi lên phái sinh từ các tính năng mà OpenAI giới thiệu ở trên. AI đang được huấn luyện sử dụng các công cụ phần mềm đang có sẵn của con người. Cụ thể là các AI Agent đang được huấn luyện để có thể tự nó mở MS Excel, tự nó mở phần mềm kế toán, tự nó mở hệ thống quản lý đơn hàng, tự nó mở các ứng dụng cụ thể như ứng dụng book xe Grab, ứng dụng đặt phòng Airbnb, Shopee, hay ứng dụng đặt vé máy bay,… AI được dạy sử dụng các phần mềm này thay con người tức là AI đang kết hợp với Automation (tự động hóa) để vượt ra khỏi khung chat, AI sẽ kết hợp việc thao tác trên nhiều phần mềm khác nhau để thực hiện nhiệm vụ như là một Nhân Viên Con Người (Human Agent), ví dụ bạn chat với AI Agent Thư Ký (vẫn là Chatbot) yêu cầu nó đặt vé máy bay cho cuộc họp với team 9h sáng tuần sau tại Hà Nội, AI Agent sẽ tự động tra các trang web VietjetAir, VNAirlines, Bamboo, tìm ra giá vé tốt nhất ở khung thời gian mà bạn đi họp, book vé, thanh toán bằng thẻ của bạn, rồi mở ứng dụng Grab, book sẵn hai chuyến xe từ nhà bạn tới sân bay và từ sân bay tới địa điểm họp cho bạn. Đây là xu hướng Ứng Dụng AI mà mình cho rằng giúp AI đi vào cuộc sống thực tế nhất hiện nay, năm 2024 đây sẽ là xu hướng làm AI Ứng Dụng chủ đạo.
Năm 2024 sẽ là năm AI Ứng Dụng bắt đầu với những thứ thực tế hơn, có ích với con người hơn. Dĩ nhiên chúng sẽ luôn đi cùng 2 mặt tốt và xấu, có những startup tập trung tạo ra AI Ứng Dụng phục vụ lợi ích của con người, nhưng cũng sẽ có những nhóm, những tổ chức tạo ra các AI Ứng Dụng đi lừa đảo đi khai thác các điểm yếu để kiếm lợi. Cái hộp pandora AI đã mở ra rồi, sẽ không có cách gì đảo ngược cuộc cách mạng mà AI đang kéo chúng ta đi, AI tốt hay xấu là do chúng ta phát triển và dạy nó cả.
Nguồn bài viết: facebook Hong Phuc Nguyen
(Link bài viết gốc của tác giả)
Tìm đọc các bài viết khác cùng chủ đề tại đây:
TRÌNH KHÁM PHÁ: SỨC MẠNH CỦA AI TRONG PHÂN ĐOẠN KHÁCH HÀNG
HÀNH TRÌNH KHÁM PHÁ: AI TỐI ƯU HOÁ MARKETING BẰNG PHÂN TÍCH DỰ ĐOÁN
HÀNH TRÌNH KHÁM PHÁ: KHI TRÍ TUỆ NHÂN TẠO GẶP TRẢI NGHIỆM KHÁCH HÀNG