AI có thông tuệ như con người?
GS. Nguyễn Văn Tuấn
Không bao giờ. Đó là câu trả lời đơn giản và dứt khoát trước những Sơn Đông Mãi Võ về AI. Nhưng nếu bạn không sử dụng AI thì đó là một thiệt thòi.
AI là gì?
AI ở đây là Artificial Intelligence, tức là ‘thông minh nhân tạo’ (chớ không phải ‘trí tuệ nhân tạo’ mà ai đó đã dịch trật lất — sẽ giải thích sau). AI là một thuật ngữ bao trùm những phương pháp như Machine Learning (ML; có khi còn gọi là Statistical Learning), Deep Learning (một phần của Machine Learning), GPT (một phần của Deep Learning), Large Language Model (một phần của GPT), chatGPT (một phần của Large Language Model). Như thấy qua cách phân nhóm trên, AI là một cách nói rất bao quát, không cụ thể.
Nói cách khác nữa, AI là một danh từ rất chung chung, nó bao hàm nhiều thuật toán trong đó, chủ yếu là Machine Learning. Và, chính vì tính chung chung này, AI trở thành một cái gì đó huyền bí, vạn năng, và được ‘thần tượng’ bởi nhiều người, kể cả trong giới khoa học.
Nhưng hãy tập trung tìm hiểu AI là gì. Về bản chất, AI có mục tiêu tạo ra những máy tính thông minh có thể mô phỏng trí thông minh con người. Xin nhấn mạnh là ‘mô phỏng’, bắt chước. Nói nôm na, công việc mô phỏng chẳng khác gì huấn luyện máy tính có những ‘bộ não’ có thể nhận biết, lí luận và ra quyết định dựa trên dữ liệu, xác suất và mô hình. Mô hình nào? Xin thưa: mô hình thống kê [1].
Hứa hẹn của AI
Nếu đọc báo phổ thông hay nghe các nhà thuyết trình gây cảm hứng, các bạn có thể nghĩ rằng AI sẽ thay thế con người nay mai. Nhưng bao nhiêu tuyên bố là thật và bao nhiêu là giật gân thì chỉ có người trong cuộc may ra được biết. Cho tới nay, có thể nói rằng AI có nhiều hứa hẹn, nhưng cũng có rất nhiều ngộ nhận.
Có người tuyên bố rằng AI sẽ thay thế bác sĩ chẩn đoán và điều trị bịnh nhân, tức sẽ không cần bác sĩ? Có nhiều nhà khoa học tuyên bố rằng AI có thể phân tích dữ liệu và soạn bài báo khoa học. Họ nói như khẳng định rằng ‘Nghiên cứu khoa học sẽ không cần giả thuyết,’ tất cả cứ để cho AI sáng tạo ra tri thức mới. Họ tự tin tuyên bố ‘Nghiên cứu khoa học theo cách làm truyền thống sẽ là quá khứ.’ Lại có người cho rằng AI sẽ đạt đến mức ‘Siêu thông minh’ (dù ý tưởng đó là gì thì chưa ai rõ).
Trong thực tế, các thuật toán Machine/Statistical Learning được ứng dụng khá nhiều trong đời sống. Từ điều phối nhiệt độ của tủ lạnh, nấu cơm tự động, chỉnh sửa đánh vần và văn phạm tiếng Anh, đọc phim X quang, đến lái máy bay đều là thành tựu của ML. Mới đây nhứt, sự ra đời của ChatGPT thể hiện một thành công ngoạn mục của ML mà chúng ta đã nghe qua nhiều.
Có người nói rằng chatGPT có thể viết một bài báo khoa học, nhưng khi tôi thử qua thì thấy văn phong giống như học trò tiểu học cố viết văn đại học. Rất nhiều câu văn generic. Rất nhiều sáo ngữ. Rất nhiều câu văn ngây ngô. Khi cho chatGPT diễn giải một biểu đồ, nó cho ra những câu văn chung chung, có khi trật lất. ChatGPT dùng xác suất và ‘associative rule’ để nối kết những câu chữ với nhau (và những câu này có trong mạng), nên có rất nhiều câu văn sai một cách rất buồn cười. Nói chung, tôi không nghĩ đó là một bài báo khoa học dù là thấp nhứt. Thật sự, tôi không hiểu sao có người dám nói rằng chatGPT có thể soạn bản thảo một bài báo khoa học.
Qui luật GIGO
Nhưng cần nhớ rằng ML cũng chỉ là một sản phẩm do con người tạo ra. Máy tính (hay mô hình thống kê) học từ con người, chớ con người không ‘học máy.’
Con người tạo ra dữ liệu, với những sai lầm của con người bên cạnh những sự thực. Dữ liệu chúng ta tạo ra đều có sai sót và thiên lệch. Nếu chúng ta đọc X quang sai, thì máy cũng sai , vì máy bắt chước con người. Nếu đa số tờ báo có thành kiến với Trump (hay ai đó) thì ML cũng sẽ cho ra câu trả lời biased về một cá nhân. Chính vì bias/thiên lệch nên có người chỉ ra rằng AI có xu hướng … kì thị chủng tộc.
Tất cả chỉ để nói lên rằng máy tính (hay mô hình thống kê) học từ dữ liệu do con người tạo ra, nên máy vẫn cho ra kết quả sai.
Người ta có câu GIGO (garbage in - garbage out, đầu vào là rác thì đầu ra cũng là rác). Mà, thông tin và dữ liệu trong mạng thì tràn đầy rác rưởi. Điều này có nghĩa là tất cả các phương pháp ML dùng dữ liệu từ mạng đều sai. Tất cả đều sai.
Những sai lầm và thất bại của ML thì đếm không xuể. Google phải bỏ cái mô hình dự báo dịch cúm mùa dựa vào những ‘từ khoá’ mà người ta tìm qua google. Cái mô hình này có thể đếm được bao nhiêu lần người ta gõ chữ ‘cúm mùa’ nhưng nó không thể nào biết tại sao và bối cảnh khi người ta gõ chữ đó. Ở bên Tàu, người ta phải bỏ cái mô hình ML nhận dạng người có tiềm năng phạm tội. Cái sai lầm của mô hình nhận dạng tội phạm qua đo lường các đặc điểm trên khuôn mặt là nhóm nghiên cứu không biết thiết kế nghiên cứu! ‘Sai sót 101’ hết sức căn bản.
Tất cả những thất bại như thế xuất phát từ thiếu lí thuyết căn bản. Nhiều người hồ hởi ứng dụng ML để giải quyết những vấn đề lớn trong y khoa thiếu kiến thức chuyên ngành và thiếu kĩ năng căn bản về thống kê học và dịch tễ học, và do đó sản phẩm của họ không thể sử dụng được.
Nhưng AI vẫn có ích
Tuy có sai, nhưng một số phương pháp ML vẫn có ích. Chẳng hạn như chúng ta rất khó đọc hàng trăm phim X quang trong vài giờ đồng hồ, nhưng ML có thể đọc mỗi phim trong vòng 5 đến 10 giây. Hay nhìn vào hình ảnh, chúng ta khó có thể phát hiện những đốm nhỏ bất thường, nhưng ML có thể giúp chúng ta nhận ra rất nhanh và tương đối chính xác.
Nên nhớ rằng ML là một công cụ giúp con người; ML không thể thay thế con người. ML có thể chỉ ra một cá nhân bị gãy xương sống, nhưng nó vẫn có thể sai, và do đó cần phải có bác sĩ xem lại.
Vài người trong chúng ta không có khả năng giải phương trình bậc 5 (ví dụ), nhưng ML có khả năng giải bài toán phức tạp đó, và giải khá nhanh. Thành ra, tuy AI hay ML không phải là hoàn thiện, nhưng chúng vẫn giúp ích cho con người và nâng cao năng suất làm việc.
Trí thông minh và trí tuệ
Đối với những vấn đề hay công việc mang tính công thức và qui trình (lặp đi lặp lại) thì ML rất tuyệt vời. ML có thể tự động chiết xuất DNA rất tốt, có thể genotype hàng triệu SNPs khỏi chê, vì đó là những qui trình có thể tự động hoá. ML có thể thay thế phi công thời gian thời tiết ổn định trên không, nhưng nó khó mà lái xe Honda ở trong làng quê. Thật vậy, đối với những vấn đề cần đến sự đánh giá và phán xét thì ML không bao giờ đạt được năng lực của con người. Lí do đơn giản là ML không bao giờ biết được bộ não con người vận hành ra sao và ML cũng không có trực giác.
Để biết sự vận hành của bộ não con người, cần phải làm … phẫu thuật bộ não. Mà, dựa trên 1 bộ não thì không đủ, nên phải làm trên hàng triệu bộ não. Ngay cả 1 bộ não thì cái ý tưởng mổ xẻ đó đã là điên rồ, là không thể, thì làm sao nói tới chuyện xa vời. ML mãi mãi chỉ là mô phỏng không hoàn hảo bộ não con người, chớ không thể thay thế bộ não con người.
Do đó, AI hay ML (hay gì nữa) sẽ không bao giờ đạt được suy nghĩ của con người. ML sẽ không bao giờ đạt được mức độ thông minh như con người. AI/ML thiếu các đặc tính cơ bản của con người như ý thức, tự nhận thức, và tiềm thức. AI/ML phụ thuộc vào dữ liệu đầu vào sự và giám sát của con người, và những cái gọi là ‘quyết định’ của AI/ML được định hình bởi các mô hình thống kê và xác suất thay vì ý thức. Đã vô thức và kém thông minh (intelligence), thì chưa thể nói đến ‘trí tuệ’ (wisdom) được.
Cần phân biệt giữa trí thông minh và trí tuệ. Trí thông minh là năng lực suy luận một cách logic theo công thức, hay khả năng trừu tượng hóa từ quan sát thực tế. Còn trí tuệ là khả năng hiểu bản chất sự việc hay con người, là ‘cảnh giới’ của tâm hồn. Nói theo Phật, tuệ là từ tâm sanh (còn thông minh là ‘tai thính mắt tinh’). Người thông minh có nhiều kiến thức và kĩ năng tốt giúp cho họ làm ra nhiều tiền và có cuộc sống tiện nghi, còn người có trí tuệ là người giàu giá trị văn hoá và họ có niềm hạnh phúc viên mãn.
Hiểu như vậy để thấy rằng máy tính hay AI/ML sẽ không thể đạt được ‘trí tuệ’; nó chỉ đạt một mức độ ‘thông minh’ nhứt định nào đó. Bởi vậy, khi nghe các diễn giả ‘nổ’ về AI, các bạn cần bình tỉnh để không bị trở thành một nạn nhân của Sơn Đông Mãi Võ. Nếu chú ý kĩ, các bạn có thể nhận ra rằng có khi các diễn giả không biết họ nói cái gì vì họ thiếu lí thuyết cơ bản [2].
Tôi thấy cách nhìn AI sau đây thực tế hơn: trí thông minh nhân tạo sẽ không thay thế con người, nhưng con người với trí thông minh nhân tạo sẽ thay thế những người không sử dụng trí thông minh nhân tạo [3]. Thành ra, chúng ta phải học và hiểu AI [2].
———
[1] Artificial Intelligence, Statistics, and Statisticians. https://magazine.amstat.org/blog/2023/09/01/aihistory
[2] Ở đại học, tôi thường dự các seminar do các giáo sư về AI đến nói chuyện. Có khi tôi hỏi họ những câu hỏi hết sức căn bản về giả định đằng sau mô hình như Cox’s hay logistic, họ trả lời không thông, vì thiếu kiến thức căn bản về thống kê học (có người thậm chí không hiểu khoảng tin cậy 95% là gì) và đa số họ thiếu kiến thức dịch tễ học.
Hôm giữa Tháng 1, tôi có một bài nói chuyện trong hội nghị EIER, một bạn trẻ hỏi tôi rằng em ấy nên học gì để hiểu cái hay và nhược điểm AI, tôi trả lời rằng em ấy nên học thống kê học và phương pháp khoa học. Không biết thống kê học và phương pháp khoa học thì chẳng khác gì người có cái công cụ mà không biết nó làm từ cái gì. Đó là tình trạng hiện nay: nhiều người nói về AI nhưng vì không có kiến thức thống kê học nên họ có khi không biết họ sai chỗ nào.
[3] https://hbr.org/2023/08/ai-wont-replace-humans-but-humans-with-ai-will-replace-humans-without-ai
“AI Won’t Replace Humans — But Humans With AI Will Replace Humans Without AI”
[4] Nhân ngày Mồng Ba, tôi xin giới thiệu đến các bạn một bài giảng về Dữ liệu Lớn. Đây là bài tôi giảng trong hội nghị khoa học thường niên EIER vào giữa Tháng Một năm 2024 tại Vũng Tàu. Tôi nói qua zoom vì không có dịp về Việt Nam lúc đó. Trong bài này tôi nói về những vấn đề rất nghiêm trọng trong Dữ liệu lớn và những sai lầm nó tạo ra. Tôi cũng nói về một nghịch lí là dữ liệu càng lớn, mô hình càng xa sự thật.
Link: