Mô hình AI có thể cung cấp dự báo thời tiết trong một giờ, một tuần hoặc thậm chí là thế kỷ tiếp theo, nhưng nó không biết thời tiết tốt hơn chúng ta

Các mô hình máy học đang chiếm lĩnh thế giới dự báo thời tiết, từ nhanh chóng "cơn mưa này sẽ kéo dài bao lâu?" đến tầm nhìn 10 ngày, cho đến những dự đoán tầm thế kỷ. Công nghệ này ngày càng quan trọng đối với các nhà khoa học khí hậu, ứng dụng và đài tin tức địa phương, nhưng nó thực sự không “biết” thời tiết tốt hơn bạn và tôi.

Trong nhiều thập kỷ, dự báo khí tượng và thời tiết chủ yếu được xác định bằng cách kết hợp dữ liệu quan sát với các mô hình và phương trình vật lý được điều chỉnh cẩn thận. Điều đó vẫn đúng -- không có khoa học nào mà không có quan sát -- nhưng kho lưu trữ dữ liệu khổng lồ đã cho phép các mô hình AI mạnh mẽ có thể đáp ứng mọi khoảng thời gian mà bạn quan tâm. Google muốn thống trị không gian này bây giờ và mãi mãi.

Trong phạm vi thời gian ngắn hơn, chúng tôi có dự báo ngay lập tức, thường tư vấn về câu hỏi "Tôi có cần mang theo ô không?" Mô hình "Dự báo tức thời" của DeepMind giải quyết vấn đề này bằng cách về cơ bản xem bản đồ lượng mưa dưới dạng một chuỗi hình ảnh và cố gắng dự đoán hình dạng trong những hình ảnh đó sẽ phát triển và thay đổi như thế nào.

Bằng cách nghiên cứu vô số giờ radar Doppler, mô hình có thể dự đoán với độ chính xác cao điều gì sẽ xảy ra tiếp theo, ngay cả trong những tình huống khá phức tạp như mặt trận lạnh mang theo tuyết hoặc mưa đóng băng (như các nhà nghiên cứu Trung Quốc trình bày dựa trên công việc của Google: https://www.nature.com/articles/s41586-023-06184-4#Abs1).

Mô hình này là một ví dụ về mức độ chính xác của dự đoán thời tiết khi hệ thống không hiểu thời tiết sẽ diễn ra như thế nào. Các nhà khí tượng học có thể cho bạn biết rằng khi một hiện tượng khí hậu này va chạm với một hiện tượng khí hậu khác, bạn sẽ có sương mù, mưa đá hoặc thời tiết nóng ẩm, bởi vì đó là những gì vật lý nói với họ. Mô hình AI không biết gì về vật lý - hoàn toàn dựa trên dữ liệu, nó đưa ra những dự đoán thống kê về điều gì sẽ xảy ra tiếp theo. Giống như ChatGPT không thực sự "biết" nó đang nói về điều gì, các mô hình thời tiết không "biết" những gì họ dự đoán.

Nguồn hình ảnh: GoogleDeepMind

Vì điều đó Mặc dù điều này có thể gây ngạc nhiên cho những người tin rằng cần có một khung lý thuyết vững chắc để đưa ra dự đoán chính xác, nhưng các nhà khoa học vẫn nghi ngại về việc áp dụng một cách mù quáng một hệ thống thậm chí không biết đến một giọt mưa hoặc một tia nắng. Tuy nhiên, những kết quả này rất ấn tượng và đủ tốt cho một câu hỏi có mức đặt cược thấp như "liệu trời có mưa trên đường tôi đến cửa hàng không?"

Các nhà nghiên cứu của Google gần đây cũng đã trình diễn một mô hình mới, dài hơn một chút có tên là MetNet-3, có thể dự đoán thời tiết tới 24 giờ trong tương lai. Như bạn có thể đoán, mô hình này mang lại dữ liệu từ quy mô lớn hơn, chẳng hạn như các trạm thời tiết trên toàn quận hoặc tiểu bang và đưa ra dự báo ở quy mô lớn hơn. Điều này áp dụng cho các tình huống như "cơn bão sẽ di chuyển qua núi hay tan?" Việc biết liệu tốc độ gió hoặc nhiệt độ có khả năng di chuyển vào vùng nguy hiểm vào sáng mai hay không là điều quan trọng để lập kế hoạch cho các dịch vụ khẩn cấp và triển khai các nguồn lực khác.

Ngày nay, có tiến bộ mới trong lĩnh vực dự báo thời tiết ở quy mô "tầm trung" (tức là 7-10 ngày tới). Các nhà nghiên cứu tại Google DeepMind đã xuất bản một bài báo trên Science mô tả GraphCast, "có thể dự đoán điều kiện thời tiết trước tối đa 10 ngày chính xác hơn và nhanh hơn hệ thống mô hình thời tiết tiêu chuẩn vàng của ngành".

GraphCast tăng quy mô không chỉ về thời gian mà còn về kích thước, bao phủ toàn bộ Trái đất với độ phân giải kinh độ/vĩ độ là 0,25 độ, hoặc khoảng 28 × 28 km tại xích đạo. Điều này có nghĩa là dự đoán điều kiện thời tiết tại hơn 1 triệu điểm trên khắp Trái đất. Tất nhiên, một số trong số chúng thú vị hơn những cái khác, nhưng điều quan trọng là xây dựng một hệ thống toàn cầu dự đoán chính xác các kiểu thời tiết chính trong khoảng tuần tới.

"Phương pháp của chúng tôi không nên được coi là sự thay thế cho các phương pháp dự báo thời tiết truyền thống mà thay vào đó chứng minh rằng MLWP có khả năng đáp ứng những thách thức của các vấn đề dự báo trong thế giới thực và có tiềm năng bổ sung cũng như cải thiện các phương pháp tốt nhất hiện tại", các tác giả viết.

Nó sẽ không cho bạn biết liệu trời sắp mưa gần nhà bạn hay chỉ ở thị trấn bên cạnh, nhưng nó rất hữu ích cho các sự kiện thời tiết lớn hơn, như bão lớn và các hiện tượng bất thường nguy hiểm khác. Những sự kiện này xảy ra trên toàn hệ thống trên phạm vi hàng nghìn km, nghĩa là GraphCast có thể mô phỏng chúng một cách chi tiết đáng kể cũng như dự đoán chuyển động và khối lượng của chúng, tất cả chỉ trong chưa đầy một phút chỉ bằng một đơn vị tính toán của Google.

Hiệu quả là một khía cạnh quan trọng. "Dự báo thời tiết bằng số", các mô hình dựa trên vật lý truyền thống, rất tốn kém về mặt tính toán. Tất nhiên, chúng có thể đưa ra dự đoán nhanh hơn thời tiết đang diễn ra, nếu không thì chúng vô giá trị -- nhưng bạn phải để siêu máy tính thực hiện công việc đó, và thậm chí sau đó, vẫn phải mất một thời gian để đưa ra dự đoán với những thay đổi nhỏ.

Ví dụ: không chắc cường độ của các dòng sông trong khí quyển sẽ tăng hay giảm trước khi lốc xoáy tấn công. Bạn có thể muốn đưa ra một số dự báo về cường độ khác nhau, một số dự báo về cường độ khác nhau và một dự báo không thay đổi. Một lần nữa, điều này rất quan trọng trong các tình huống như bão, lũ lụt và cháy rừng. Biết một khu vực phải được sơ tán trước một ngày có thể cứu được mạng sống.

Những nỗ lực này có thể trở nên rất phức tạp khi có rất nhiều biến số khác nhau cần xem xét và đôi khi mô hình phải được chạy hàng chục, thậm chí hàng trăm lần để thực sự hiểu mọi thứ sẽ diễn ra như thế nào. Nếu những dự đoán này mất một giờ mỗi lần trên một cụm siêu máy tính thì đó là một vấn đề; nếu chúng chỉ mất một phút mỗi lần trên máy tính để bàn có hàng nghìn máy tính thì điều đó hoàn toàn ổn -- trên thực tế, bạn có thể bắt đầu nghĩ đến việc dự đoán những thay đổi ngày càng chi tiết hơn!

Đó là ý tưởng đằng sau dự án lập mô hình khí hậu tại Viện Trí tuệ Nhân tạo Allen (AI2). Bạn sẽ làm gì nếu muốn dự đoán không chỉ 10 lựa chọn khác nhau có thể xuất hiện vào tuần tới mà còn hàng nghìn lựa chọn có thể xuất hiện trong thế kỷ tới?

Loại khoa học khí hậu này rất quan trọng đối với tất cả các loại kế hoạch dài hạn, nhưng do số lượng lớn các biến số cần được xử lý và thời gian dự đoán kéo dài hàng thập kỷ nên sức mạnh tính toán cần thiết chắc chắn cũng rất lớn. Do đó, nhóm của AI2 đang hợp tác với các nhà khoa học trên khắp thế giới để sử dụng máy học để tăng tốc và cải thiện những dự đoán này, từ đó cải thiện những “dự đoán” quy mô thế kỷ.

Các mô hình ClimSim hoạt động tương tự như các mô hình đã thảo luận ở trên: thay vì cung cấp đầu vào số vào mô hình được điều chỉnh thủ công, dựa trên vật lý, chúng xử lý tất cả dữ liệu dưới dạng trường vectơ liên kết với nhau. Khi một số tăng lên, một số khác chắc chắn sẽ tăng một nửa và số thứ ba giảm một phần tư và ngay cả khi mô hình học máy không biết rằng các mối quan hệ này liên quan đến carbon dioxide trong khí quyển, nhiệt độ bề mặt và sinh khối đại dương, thì những mối quan hệ này sẽ được nhúng vào bộ nhớ của mô hình học máy.

Người đứng đầu dự án cho biết mô hình họ xây dựng rất chính xác, trong khi chi phí tính toán thấp hơn nhiều. Nhưng ông cũng thừa nhận rằng các nhà khoa học, tuy có tư duy cởi mở, nhưng cũng (một cách tự nhiên) hoài nghi về công việc của họ. Nếu bạn muốn tự mình xem thì mã ở đây: https://github.com/leap-stc/ClimSim/tree/main

Vì thang thời gian quá dài và khí hậu đang thay đổi quá nhanh nên rất khó để tìm ra sự thật cơ bản phù hợp cho các dự đoán dài hạn, nhưng giá trị của những dự đoán này đang tăng lên từng ngày. Như các nhà nghiên cứu tại GraphCast đã chỉ ra, đây không phải là sự thay thế cho các phương pháp khác mà là một sự bổ sung. Không còn nghi ngờ gì nữa, các nhà khoa học khí hậu sẽ muốn có mọi công cụ mà họ có thể sử dụng được.