ChatGPT sử dụng cách riêng của mình để hiểu thế giới. Công nghệ tương tự có thể được sử dụng để học ngôn ngữ của động vật không? Solomon có thể giao tiếp với động vật không phải vì anh sở hữu những vật phẩm ma thuật mà vì năng khiếu quan sát của mình. ——Conrad Lorenz, "Chiếc nhẫn của Vua Solomon" Trong các tác phẩm lấy động vật làm trung tâm như "Vua sư tử" và "Zootopia", tác giả thường nhân cách hóa các nhân vật và sử dụng phương pháp tư duy và giao tiếp của con người để thúc đẩy cốt truyện.

Tuy nhiên, loại công việc này cũng có thể dẫn đến sự bất hòa về nhận thức. Khi giao tiếp với động vật, chúng ta có thể áp đặt ý tưởng và thành kiến ​​của mình lên động vật. Ví dụ, “con cừu quỳ cho con bú” không liên quan gì đến lòng biết ơn hay lòng hiếu thảo mà do cấu tạo dạ dày đặc biệt của cừu mà con người sẽ tự phóng chiếu hành vi của cừu con.


Công việc nhận thức động vật truyền thống chủ yếu xây dựng từ vựng, nhưng các khái niệm như "nước", "uống" và "khô" có thể không tồn tại hoặc không có ý nghĩa trong thế giới sinh vật dưới nước và không có sự tương ứng với các khái niệm của con người trong giao tiếp động vật; và giao tiếp giữa các loài động vật không nhất thiết liên quan đến âm thanh mà còn bao gồm cử chỉ, trình tự hành động hoặc thay đổi kết cấu da.

Về mặt lý thuyết, các mô hình học máy tốt hơn con người trong việc tóm tắt các mối tương quan lỏng lẻo giữa các từ. Đầu vào của mạng nơ-ron không đưa ra bất kỳ giả định nào về bản chất của dữ liệu đầu vào. Chỉ cần một khuôn mẫu nhất định xuất hiện thường xuyên thì có thể khám phá được thông tin chứa đựng trong giao tiếp của động vật.

Sáng kiến ​​dịch thuật loài giáp biển (CETI), do các tổ chức nghiên cứu như Đại học Thành phố New York, UC Berkeley, MIT, Harvard, Google Research và National Geographic khởi xướng, sử dụng hệ thống xử lý ngôn ngữ tự nhiên để phân tích dữ liệu khổng lồ về cá nhà táng và có kế hoạch giao tiếp trực tiếp với cá nhà táng hoang dã trong tương lai.


EarthSpeciesProje do Aza Raskin và những người khác, ESP) đồng sáng lập) đã mở nguồn chuẩn BEANS về phát âm động vật đầu tiên, có thể đo lường hiệu suất của các thuật toán học máy trên dữ liệu âm thanh sinh học; nó cũng đã phát triển mô hình cơ bản đầu tiên cho cách phát âm của động vật AVES, mô hình này có thể được sử dụng cho nhiều nhiệm vụ khác nhau như phát hiện và phân loại tín hiệu.

Với sự tiến bộ của công nghệ AI sáng tạo, một ngày nào đó có thể khám phá ra ý nghĩa thực sự đằng sau giao tiếp của động vật.

Vương quốc động vật phức tạp

Năm 1974, nhà triết học Thomas Nagel đã xuất bản một bài báo chuyên đề có tên "Trở thành một con dơi thì như thế nào?" "(WhatIsItLiketoBeaBat?"), anh ấy tin rằng cuộc sống của một con dơi rất khác với cuộc sống của con người nên con người có thể không bao giờ thực sự biết câu trả lời cho câu hỏi này.

Sự hiểu biết của chúng ta về thế giới được định hình bởi các khái niệm của con người. Muốn biết con dơi là thế nào Cách duy nhất để trở thành một đứa trẻ là trở thành một con dơi và có khái niệm về con dơi.

Tuy nhiên, chúng ta vẫn có thể suy ra một phần cách suy nghĩ của loài dơi. Ví dụ, loài dơi sống ở nơi cao và khái niệm lên xuống có thể bị đảo ngược thông qua khả năng định vị bằng tiếng vang, v.v., nhưng chúng ta không thể có được trải nghiệm sống của loài dơi.

TAG PH79Nếu sư tử có thể nói chuyện, chúng ta sẽ không thể hiểu được vì bộ não con người không thể đồng cảm với những cảm xúc và khái niệm được truyền tải bằng ngôn ngữ sư tử - Ludwig Wittgenstein


Nhưng không phải tất cả các loài động vật. Tổ tiên chung cuối cùng của chúng với tinh tinh sống cách đây từ 6 triệu đến 8 triệu năm, trong khi tổ tiên chung cuối cùng của chúng với bạch tuộc sống ở đại dương Tiền Cambri khoảng 600 triệu năm trước.Sau khi được dạy, tinh tinh có thể học ngôn ngữ ký hiệu của con người, thậm chí có thể hiểu những hướng dẫn phức tạp của con người và giao tiếp bằng ký hiệu bàn phím, nhưng như đã đề cập ở phần đầu, chúng ta cũng có thể nhân hóa quá mức hành vi của tinh tinh.

Đối với những loài có quan hệ họ hàng xa hơn với con người, việc hiểu cách chúng giao tiếp trở nên khó khăn hơn. Ví dụ, ong và một số loài chim có thể nhìn thấy tia cực tím trong quang phổ khả kiến, còn dơi, cá heo, chó và mèo có thể nghe thấy sóng siêu âm. Mỗi loài có những đặc điểm riêng.

Sử dụng AI để hiểu động vật

Britt Selvitelle, nhà khoa học máy tính tại Dự án Loài Trái đất (Dự án Loài Trái đất), cho biết họ đang nỗ lực giải mã ngôn ngữ không phải của con người đầu tiên và có thể đạt được ngôn ngữ đó trong vòng 5 đến 10 năm.

Trong lĩnh vực ngôn ngữ động vật, mặc dù các nhà nghiên cứu đã tích lũy rất nhiều kiến ​​thức trong nhiều thập kỷ nhưng trên thế giới vẫn chưa có "Hòn đá Rosetta" nào có thể dịch được ngôn ngữ của con người và ngôn ngữ của động vật, cũng như không có tiêu chuẩn vàng nào để dán nhãn "ngôn ngữ động vật".

Về cơ bản, trí tuệ nhân tạo là một công cụ dựa trên dữ liệu. Các mô hình ngôn ngữ được đào tạo trước có thể học cách biểu diễn dữ liệu bên trong theo cách không được giám sát thông qua dữ liệu khổng lồ.

Đánh giá từ hiệu suất mạnh mẽ của ChatGPT, công nghệ AI tổng hợp có thể có phương pháp biểu diễn nội bộ độc đáo của riêng nó thay vì áp dụng các khái niệm của con người, vì vậy các nhà nghiên cứu bắt đầu chuyển sang công nghệ AI để phân tích dữ liệu và thu được các thuật ngữ có ý nghĩa cho động vật.


Trong Dự án Loài trên Trái đất, dữ liệu được thu thập dưới dạng âm thanh, chuyển động và video, bao gồm các loài động vật trong tự nhiên hoặc trong điều kiện nuôi nhốt, đồng thời kèm theo ghi chú của các nhà sinh vật học về hoạt động của các loài động vật vào thời điểm đó và trong bối cảnh nào.

Khi Internet of Things phát triển, việc đặt thiết bị ghi âm giá rẻ và đáng tin cậy (như micrô hoặc máy ghi sinh học) trên động vật trong tự nhiên ngày càng trở nên dễ dàng hơn.

Điểm chuẩn âm thanh động vật BEANS

Trong lĩnh vực âm sinh học, việc ứng dụng thành công công nghệ máy học dựa trên Một tập hợp dữ liệu chất lượng cao được quản lý cho một nhiệm vụ cụ thể nhưng cho đến nay vẫn chưa có một tiêu chuẩn chung cho nhiều nhiệm vụ và các loài để đo lường hiệu suất của các kỹ thuật học máy theo cách được kiểm soát và tiêu chuẩn hóa, đồng thời đánh giá các kỹ thuật mới được đề xuất so với các kỹ thuật hiện có.


Liên kết giấy: https://arxiv.org/pdf/2210.12300.pdfTAGPH 32

Liên kết dữ liệu: https://github.com/earthspecies/beans

BEANS ((theBEnchmarko fANimalSounds, điểm chuẩn cho âm thanh động vật) là tập hợp các nhiệm vụ âm sinh học và bộ dữ liệu công khai được thiết kế để đo lường hiệu suất của các thuật toán học máy trong lĩnh vực âm sinh học, bao gồm hai nhiệm vụ phổ biến trong âm sinh học: phân loại và phát hiện

.

BEANS bao gồm 12 bộ dữ liệu bao gồm nhiều loài, bao gồm chim, động vật có vú trên cạn và dưới biển, loài Anurans và côn trùng.

Ngoài các bộ dữ liệu, bài viết còn đề xuất một bộ máy tiêu chuẩn.


Cả mã chuẩn và mã cơ sở đều là nguồn mở và các nhà nghiên cứu hy vọng rằng BEANS có thể cung cấp Thiết lập một bộ dữ liệu tiêu chuẩn mới cho học máy trong nghiên cứu âm sinh học

Mô hình lớn về cách phát âm của động vật AVES

Trong lĩnh vực âm thanh sinh học, việc thiếu dữ liệu huấn luyện được gắn nhãn rõ ràng đã cản trở rất nhiều đến việc sử dụng các mô hình mạng lưới thần kinh quy mô lớn được huấn luyện theo cách có giám sát trong lĩnh vực này.

Để sử dụng một lượng lớn dữ liệu âm thanh chưa được gắn nhãn, các nhà nghiên cứu đã đề xuất AVES (Bộ mã hóa giọng nói của động vật dựa trên tính năng Tự giám sát, dựa trên bộ mã hóa giọng nói của động vật tự giám sát), một mô hình biểu diễn âm thanh tự giám sát dựa trên loại Máy biến áp, có thể được sử dụng để mã hóa giọng nói của động vật.


Liên kết giấy: https://arxiv.org/pdf/2210.144.pdf

Liên kết mẫu: https://github.com/earthspecies/aves

Các nhà nghiên cứu thuộc một nhóm khác nhau. Mô hình AVES được đào tạo trước về tập dữ liệu âm thanh không được gắn nhãn và được tinh chỉnh cho các tác vụ âm thanh sinh học xuôi dòng. mô hình hàng đầu được đào tạo trên tập dữ liệu phân loại âm thanh có chú thích

Kết quả thử nghiệm cũng cho thấy rằng việc thiết kế cẩn thận một tập hợp con đào tạo nhỏ phù hợp với nhiệm vụ tiếp theo là một cách hiệu quả để đào tạo các mô hình biểu diễn âm thanh chất lượng cao. Khi xã hội phương Tây lần đầu tiên phát hiện ra tiếng hót của cá voi, xã hội loài người đã đình chỉ việc săn bắt cá voi biển sâu và thúc đẩy Cơ quan Bảo vệ Môi trường (Env ironmentalProtectionAgency)


Khi lộ trình công nghệ của Dự án Loài Trái đất tiến bộ, Chúng ta có thể tìm hiểu thêm về các sinh vật xung quanh mình, thu thập thêm dữ liệu và phát triển mới điểm chuẩn và mô hình cơ bản, để chúng ta có thể bảo vệ hành tinh xanh này tốt hơn. Raskin tin rằng trong 12-36 tháng tới, nhóm sẽ có thể giao tiếp với động vật, chẳng hạn như tạo ra một con cá voi hoặc con quạ nhân tạo có thể nói chuyện với cá voi hoặc quạ theo một cách không thể phân biệt được, nhưng điểm mấu chốt là chúng ta cũng cần hiểu mô hình đang nói gì trước khi có thể tiếp tục cuộc trò chuyện.Nhóm Raskin cũng đang thảo luận về cách sử dụng các phương pháp trí tuệ nhân tạo này một cách có trách nhiệm. Hiện nay đã quy định rằng các phương pháp này phải được chuẩn bị trong bất kỳ cuộc thử nghiệm nào. Lộ trình kỹ thuật chỉ ra những rủi ro tiềm ẩn, chẳng hạn như cản trở việc săn bắn, kiếm ăn hoặc giao phối, đồng thời cũng có thể gây ra lỗi cho động vật.

Con người chỉ học cách nói và giao tiếp bằng âm thanh từ 100.000 đến 300.000 năm trước, trong khi cá voi và cá heo đã sử dụng âm thanh để truyền lại văn hóa và bài hát trong 34 triệu năm.

Nếu âm thanh AI được gửi ngẫu nhiên giữa các loài cá voi, nó có thể gây thiệt hại cho 34 triệu năm văn hóa.

Đó là lý do tại sao phần lớn công việc cho đến nay trong Dự án Loài hành tinh là thu thập dữ liệu và tạo ra nền tảng—các đường cơ sở và mô hình nền tảng sẽ thúc đẩy tiến bộ trong tương lai—không giống như những gì các công ty và tổ chức trên khắp thế giới đang làm hàng ngày với trí tuệ nhân tạo và học máy, chỉ ở quy mô lớn hơn nhiều.

Nếu AI có thể giúp chúng ta hiểu động vật đang nói gì thì khả năng sử dụng AI của chúng ta có những giới hạn nào?

Nếu AI có thể giúp chúng ta hiểu về động vật, nó sẽ dạy chúng ta điều gì về con người?


Raskin và Zacarian hy vọng rằng việc dịch ngôn ngữ của động vật cuối cùng sẽ trở thành một trong những bước ngoặt trong lịch sử thế giới, giống như phát hiện đầu tiên về bài hát của cá voi hay bức ảnh về Blue Dot năm 1990, những khoảnh khắc đã thay đổi quan điểm và hiểu biết của chúng ta về thế giới.