Mô hình AI đa phương thức

GPT4 của OpenAI, Llama 2 của Meta và Mistral đều là ví dụ về những tiến bộ trong các mô hình ngôn ngữ lớn. Công nghệ này vượt xa văn bản với các mô hình AI đa phương thức, cho phép người dùng trộn và kết hợp nội dung dựa trên văn bản, âm thanh, hình ảnh và video để nhắc nhở và tạo nội dung mới. Cách tiếp cận này bao gồm việc kết hợp dữ liệu, chẳng hạn như hình ảnh, văn bản và giọng nói, với các thuật toán nâng cao để đưa ra dự đoán và tạo ra kết quả.

Vào năm 2024, AI đa phương thức dự kiến phát triển đáng kể, mở ra sự thay đổi về khả năng AI tổng hợp. Các mô hình này đang phát triển vượt ra ngoài các chức năng chế độ đơn truyền thống, kết hợp các loại dữ liệu đa dạng như hình ảnh, ngôn ngữ và âm thanh. Kết quả của quá trình chuyển đổi sang các mô hình đa phương thức này là AI sẽ trở nên trực quan và năng động hơn.

Mô hình ngôn ngữ nhỏ mạnh mẽ

Nếu 2023 là năm của các mô hình ngôn ngữ lớn (LLM) thì năm 2024 sẽ chứng kiến sức mạnh của các mô hình ngôn ngữ nhỏ (SLM). LLM được đào tạo trên các bộ dữ liệu lớn như Common Crawl và The Pile, với hàng terabyte dữ liệu bao gồm các bộ dữ liệu này được trích xuất từ ​​hàng tỷ trang web có thể truy cập công khai.

Mặc dù dữ liệu thực sự có lợi trong việc dạy LLM tạo ra nội dung có ý nghĩa và dự đoán từ tiếp theo, song nó cũng thừa hưởng những tính chất dựa trên nội dung chung trên Internet.

Bởi vậy, các SLM được đào tạo trên các bộ dữ liệu hạn chế hơn nhưng vẫn bao gồm các nguồn chất lượng cao như sách giáo khoa, tạp chí và nội dung có thẩm quyền, có thể được chú trọng hơn. Những mô hình này nhỏ hơn về số lượng tham số cũng như yêu cầu về bộ nhớ và lưu trữ, cho phép chúng chạy trên phần cứng ít tốn kém hơn. SLM tạo ra nội dung có chất lượng tương đương với một số đối tác lớn hơn của chúng, mặc dù kích thước chỉ bằng một phần nhỏ so với LLM.

PHI-2 và Mistral 7B của Microsoft là hai SLM đầy hứa hẹn sẽ cung cấp năng lượng cho thế hệ ứng dụng AI tổng hợp tiếp theo.

Tác nhân tự trị

Các tác nhân tự trị là một chiến lược đổi mới để xây dựng các mô hình AI tổng quát. Các tác nhân này là các chương trình phần mềm tự trị được thiết kế để hoàn thành một mục tiêu cụ thể. Đối với AI tổng quát, khả năng các tác nhân tự trị tạo ra nội dung không cần sự can thiệp của con người sẽ vượt qua khỏi những hạn chế kỹ thuật thông thường.

Các tác nhân này sử dụng dữ liệu để tìm hiểu, thích ứng với các tình huống mới và đưa ra quyết định mà không cần nhiều sự can thiệp của con người. Ví dụ: OpenAI đã tạo ra các công cụ như GPT tùy chỉnh giúp sử dụng hiệu quả các tác nhân tự trị, cho thấy sự tiến bộ đáng kể trong lĩnh vực trí tuệ nhân tạo.

AI đa phương thức, kết hợp nhiều kỹ thuật AI khác nhau như xử lý ngôn ngữ tự nhiên, thị giác máy tính và học máy, rất quan trọng trong việc phát triển các tác nhân tự trị. Nó có thể đưa ra dự đoán, thực hiện hành động và tương tác phù hợp hơn bằng cách phân tích các loại dữ liệu khác nhau cùng lúc và áp dụng bối cảnh hiện tại.

Các khung như LangChain và LlamaIndex là một số công cụ phổ biến được sử dụng để xây dựng các tác nhân dựa trên LLM. Vào năm 2024, chúng ta sẽ thấy các khuôn khổ mới tận dụng AI đa phương thức, cải thiện trải nghiệm của khách hàng, có lợi cho các ngành dọc như du lịch, khách sạn, bán lẻ và giáo dục.

Mô hình AI mở

Sang năm 2024, các mô hình AI mở, có tính tổng hợp dự kiến sẽ phát triển đáng kể, với một số dự đoán cho thấy chúng sẽ có thể so sánh với các mô hình độc quyền.

Llama 2 70B, Falcon 180B của Meta và Mixtral-8x7B của Mistral AI đã trở nên cực kỳ phổ biến vào năm 2023, với hiệu suất tương đương với các mẫu độc quyền như GPT 3.5, Claude 2 và Jurassic-2.

Trong tương lai, khoảng cách giữa các mô hình mở và mô hình độc quyền sẽ được thu hẹp, cung cấp cho doanh nghiệp thêm lựa chọn để lưu trữ các mô hình AI tổng hợp trong môi trường kết hợp hoặc tại chỗ.

Phiên bản tiếp theo của các mô hình mở từ Meta, Mistral và có thể cả những người mới tham gia sẽ được phát hành dưới dạng các lựa chọn thay thế khả thi cho các mô hình độc quyền có sẵn dưới dạng API.

(Theo Forbes)

NGUỒN:Những xu hướng trí tuệ nhân tạo tiên tiến trong năm 2024 (VNN 13/2/2024)-  [https://www.blogger.com/blog/post/edit/5638668101773813427/9154764885217239040#]

TIN LIÊN QUAN: Microsoft, Google và AMD phải học công ty Trung Quốc cách kiếm tiền từ AI [https://vietnamnet.vn/microsoft-google-va-amd-phai-hoc-cong-ty-trung-quoc-cach-kiem-tien-tu-ai-2245874.html]

NHÂN LOẠI VÀ SỰ PHẢI TRÁI CỦA AI

HIỆU MINH/ KTSG 9-2-2024

(KTSG) – Mọi năm khi gửi lời chúc mừng năm mới dân ta đã có một mẫu quen thuộc “Sang năm mới chúc gia đình sức khỏe dồi dào, làm ăn tiến tới…”. Tôi nhờ người bạn làm IT hỏi AI xem nên chúc Tết ra sao thì ChatGPT tư vấn rằng bạn nên dùng câu “Chúc mừng năm mới” cho mọi trường hợp mà không bị “phốt”.

Nếu nói về công nghệ năm qua (2023) thì sự kiện ChatGPT ra mắt làm chấn động thế giới, và nhiều chuyên gia dự đoán rằng cuộc cách mạng trí tuệ nhân tạo (AI) đang bùng nổ và thay đổi nhiều khía cạnh của cuộc sống con người, từ sáng tạo nghệ thuật, thêm việc mới, bớt việc cũ, báo chí thay đổi, đến hỗ trợ khám và điều trị bệnh một cách tinh vi. Họ cũng cảnh báo công nghệ AI này đang phát triển với tốc độ đáng báo động, gây ra những rủi ro nghiêm trọng cho chính nhân loại.

Dân làm phim Hollywood tuần hành mấy tháng liền vì việc làm đang bị AI dần thay thế. Có những cảnh quay xưa mất cả triệu đô, leo trèo cao vút, dựng hiện trường, thuê máy bay, đóng thế, thì nay nhờ có AI sáng tạo, không cần phim trường vẫn làm được. Chỉ cần thuê mấy tay lập trình như kiểu thuê Grab giá rẻ, dùng nguồn mở miễn phí, không cần bản quyền.

Dù muốn hay không thì AI đã và đang ở trong cuộc sống, không ai có thể trốn chạy mà phải đối mặt và tìm cách sống chung, dùng AI cho mục đích tốt lành thay vì dùng công nghệ này để gây hại cho nhân loại.

Mặt trái: Deepfake – giả mạo khủng

Đầu tháng 12-2023, CNN giới thiệu về AI trong chuyên mục The Whole Story của người dẫn chương trình nổi tiếng Anderson Cooper. Mở đầu, để gây choáng, ông đưa một clip do chính ông nói và một clip tương tự do AI tạo ra bắt chước giọng và hình ảnh của ông. Nếu không biết trước thì người xem không thể phân biệt đâu là Cooper thật, đâu là giả. Bản thân Cooper cũng chỉ phát hiện vài từ ông không nói trong kịch bản.

Cũng khó tưởng tượng, đó là công trình của sinh viên Matyas Bohacek chuyên về AI của Đại học Stanford, Mỹ, do CNN đặt hàng làm giả Anderson Cooper. Anh dùng mã nguồn mở để lập trình trong thời gian ngắn, đương nhiên anh chuyên nghiên cứu về nhiễu loạn thông tin, ngôn ngữ ký hiệu, và truyền thông, mới có thể lập trình giả mạo khủng như vậy.

Đang mơ mộng trong mưa xuân lãng đãng, tôi bỗng giật thót vì tiếng còi xe. Hóa ra chưa phải năm 2124 mà mới là 2024 dù là năm Rồng nhưng chưa bay cao. Hy vọng 100 năm nữa thì mình về quê ăn Tết sẽ vui như Tết bởi thằng AI điều hành giao thông.

Trên YouTube cũng có những clip giới thiệu cựu Tổng thống Mỹ Donald Trump hay đương kim Phó tổng thống Kamala Harris và nhiều nhà lãnh đạo quốc gia nói về những điều mà chính họ chưa hề nói bao giờ. Tội phạm mạng khai thác AI vào các mục đích xấu, trở thành công cụ lừa đảo, thậm chí làm nhục người khác như ghép cảnh khiêu dâm không có thật.

Ngay từ năm 2022, Matyas Bohacek đã có công trình mang tính cảnh báo “Bảo vệ các nhà lãnh đạo thế giới khỏi deepfake bằng cách sử dụng phong cách trên khuôn mặt, cử chỉ và giọng nói” vì anh sợ nhiễu loạn thông tin do AI tạo ra sẽ ảnh hưởng xấu tới cả thế giới, nhất là trong các chu kỳ bầu cử hay thời điểm xung đột vũ trang, thông tin nhạy cảm bị làm giả sẽ là tai họa khó lường.

Hồi tháng 5-2023 có tin một vụ nổ tại Lầu Năm Góc, kèm theo một hình ảnh do AI tạo ra, đã lan truyền trên Twitter, cũng gây sụt giảm 0,26% thị trường chứng khoán trong một thời gian ngắn.

Theo một báo cáo của Onfido, một công ty chuyên xác minh ID có trụ sở tại London, các nỗ lực lừa đảo bằng deepfake năm 2023 đã tăng lên con số khổng lồ 31 lần so với cùng kỳ năm trước. Ở Singapore con số này cũng tới 500%.

Onfido cho rằng sự gia tăng này là do các công cụ trực tuyến đơn giản và rẻ tiền tăng chóng mặt, cũng như AI có khả năng sáng tạo mà ứng dụng hoán đổi khuôn mặt, giả giọng nói là những ví dụ phổ biến nhất.

Mặt phải: Kết hợp với con người, AI chống deepfake cũng khủng

Lo sợ thế thôi, người tạo ra AI xấu thì cũng có đội ngũ tạo ra AI tốt để chống lại, giống như cánh viết phần mềm cho máy tính, một bên tạo ra ứng dụng hữu hiệu, một bên tạo ra virus để phá hoại. Đó là một thực tế và công nghệ AI cũng vậy.

Để chuẩn bị tranh cử năm 2024, Tổng thống Mỹ Joe Biden đã tập hợp một lực lượng đặc nhiệm sẵn sàng ứng phó với các hình ảnh và video gây hiểu lầm do AI tạo ra, soạn thảo hồ sơ tòa án và chuẩn bị các thủ tục pháp lý mới thời AI mà họ có thể triển khai để chống lại những nỗ lực thông tin sai lệch tiềm ẩn mà các chuyên gia công nghệ đã cảnh báo có thể làm gián đoạn cuộc bỏ phiếu.

Giải quyết những mối đe dọa kiểu deepfake thì cũng phải có AI. Phát triển và cải tiến các công nghệ phát hiện deepfake như các công ty phần mềm chống virus, cần các thuật toán phức tạp hơn, cũng như phát triển các phương pháp mới có thể xác định deepfake dựa trên bối cảnh, siêu dữ liệu hoặc các yếu tố khác của chúng.

Một giải pháp tiềm năng khác là thúc đẩy kiến thức truyền thông và tư duy phản biện, bằng cách giáo dục công chúng về sự nguy hiểm của deepfake và cách phát hiện ra chúng, thì có thể giảm tác động của các chiến dịch độc hại này.

Kết hợp khung tin cậy kỹ thuật số vào sử dụng hàng ngày có thể giúp trấn an các cá nhân rằng các công nghệ và dịch vụ kỹ thuật số cũng như các tổ chức cung cấp chúng sẽ bảo vệ lợi ích của tất cả các bên liên quan, duy trì các kỳ vọng và giá trị xã hội.

Cuối cùng, cũng phải xem xét ý nghĩa đạo đức của AI và công nghệ deepfake. Chính phủ và các cơ quan quản lý có thể đóng một vai trò quan trọng trong việc định hình các chính sách điều chỉnh công nghệ deepfake, thúc đẩy phát triển và sử dụng công nghệ minh bạch, trách nhiệm, đảm bảo rằng AI không gây hại.

Tin rất tốt lành: AI chữa bệnh cũng khủng

Chương trình CNN nói trên chiếu khá lâu về một người Mỹ đi xe đạp ở Vạn Lý Trường Thành và bị ngã. Khi tỉnh dậy trong bệnh viện thì anh được biết hai chân của mình không thể cử động được nữa và sẽ phải ngồi xe lăn suốt đời do dây thần kinh vận động chân nối từ cột sống tới não bị tổn thương, không có khả năng phục hồi.

Bỗng một ngày đẹp trời, anh được đề nghị dùng thử AI thông qua một cuộc giải phẫu ở sống lưng và não, cấy một thiết bị kích hoạt dây thần kinh bị liệt kia. Và thế là anh đứng dậy được, hai tay bám vào xe đẩy có máy tính (thực chất là một AI) theo dõi hoạt động của bộ não điều khiển anh lê từng bước.

Đây là bước tiến vĩ đại của AI trong y học giúp chữa bệnh, vì dường như AI có thể đoán được bộ não người đang muốn gì. Người ta đang hy vọng, theo thời gian, việc làm quen dần với phản ứng của não với chỉ dẫn của AI thì dây thần kinh vận động chân bị đứt gãy có thể tự phục hồi.

Việc người ngồi xe lăn suốt đời do bị liệt bỗng một hôm đứng lên được nhờ AI, đó là những hy vọng tuyệt vời trong nhiều lĩnh vực của y học khi ứng dụng AI.

Tất nhiên, AI chưa tới lúc có thể lý giải được một chàng đang đi trên phố, bỗng nhìn thấy một người đẹp lại tỏ vẻ đắm say. Nếu tới được giới hạn đó thì AI là người thật mất rồi.

Giấc mơ xuân

Cũng trong chương trình đó, CNN giới thiệu một chiếc ô tô tự hành trên phố ở Mỹ, không có người lái mà vẫn dừng đèn đỏ, rẽ trái, rẽ phải, tăng tốc như bao xe khác đang lưu thông. Người ta dự đoán trong những thập niên tới, ô tô do AI điều khiển sẽ chiếm ưu thế trên đường.

Mải nghĩ mông lung về bài viết này, tôi chợt thấy đường về quê ăn Tết năm nay vẫn đông xe như mọi năm, xe phóng vun vút, đổi làn, lên xuống cao tốc nhẹ nhàng, không còn cảnh chen chúc, còi inh ỏi, tắc đường cả ngày. Trong nội thành cũng thế, sao như chỗ không người. Nếu quay flycam thì nghĩ mình đang xem phim viễn tưởng.

Nhìn kỹ mới phát hiện ra tất cả các xe không có người lái như drone chuyển phát nhanh bay trên trời, có camera 360 giám sát hành trình, chỉ cần định vị điểm đến là xe sẽ đưa ta đến nơi đúng giờ, như drone bay tới đúng địa chỉ được số hóa.

Hóa ra vẫn hạ tầng của Hà Nội như hiện nay, để AI lái xe sẽ hết tắc đường, và cảnh sát không phải vất vả kiểm tra nồng độ cồn, về quê tha hồ dzô dzô. Cảnh sát cũng là AI luôn, khỏi phải lo lương bổng, bảo hiểm.

Đang mơ mộng trong mưa xuân lãng đãng, tôi bỗng giật thót vì tiếng còi xe. Hóa ra chưa phải năm 2124 mà mới là 2024 dù là năm Rồng nhưng chưa bay cao. Hy vọng 100 năm nữa thì mình về quê ăn Tết sẽ vui như Tết bởi thằng AI điều hành giao thông.

NGUỒN: Nhân loại và sự phải trái của AI (KTSG 13/2/2024)-Hiệu Minh-[https://www.blogger.com/blog/post/edit/5638668101773813427/9154764885217239040#]

TIN LIÊN QUAN: