Cộng đồng Linux luôn có những phản ứng trái chiều trước sự xuất hiện của các mô hình ngôn ngữ lớn và trí tuệ nhân tạo tổng hợp, nhưng Ubuntu gần đây đã thể hiện rõ quan điểm của mình thông qua một bài thảo luận dự án về "Hướng phát triển tương lai của AI trong Ubuntu": bắt đầu với Ubuntu 26.10 "Stonking Stingray" được phát hành vào tháng 10 năm 2026, tiếp theo là 26.04. Trong phiên bản chính tiếp theo sau đó, Ubuntu sẽ dần dần bổ sung các tính năng AI mới cho toàn bộ hệ điều hành, nhưng những tính năng này sẽ khả năng sẽ được cung cấp theo cách tùy chọn thay vì bị ép buộc.

Jon Seager, trưởng nhóm kỹ thuật của dự án, cho biết sau khi bước sang năm 2026, Canonical đã bắt đầu khuyến khích các nhà phát triển nội bộ sử dụng các công cụ AI tích cực hơn, nhưng trọng tâm không phải là theo đuổi các chỉ số dữ liệu hời hợt, chẳng hạn như việc sử dụng mã thông báo hay "số lượng mã được điều khiển bởi AI" "Viết", mà là hy vọng rằng các kỹ sư sẽ thực sự hiểu AI hoạt động hiệu quả trong trường hợp nào và trong trường hợp nào thì AI không lý tưởng, đồng thời đo lường nó thông qua sản lượng thực tế. Theo ông, công ty sẽ không buộc tất cả các nhóm áp dụng cùng một công nghệ AI mà sẽ khuyến khích các nhóm khác nhau thử các giải pháp khác nhau và tích lũy thêm kinh nghiệm ở cấp tổ chức trong những tháng tới.

Seager cũng nhấn mạnh rằng Canonical sẽ không đẩy AI vào mọi ngóc ngách của Ubuntu mà sẽ sử dụng "trách nhiệm" và "minh bạch" làm nguyên tắc cốt lõi để thúc đẩy công việc này. Về mặt lựa chọn mô hình, Canonical sẽ ưu tiên cho các mô hình trọng lượng mở, chuỗi công cụ nguồn mở và các phương pháp triển khai dựa nhiều nhất có thể vào suy luận ngoại tuyến cục bộ; đồng thời, khi công ty đánh giá các mô hình, họ sẽ không chỉ xem xét liệu các trọng số có được mở hay không mà còn tập trung vào việc liệu các điều khoản cấp phép của mô hình có tương thích với các giá trị của Ubuntu hay không.

Theo kế hoạch của Canonical, các chức năng AI trong Ubuntu trong tương lai có thể được chia đại khái thành hai loại: một là “chức năng AI tiềm ẩn” và loại còn lại là “chức năng AI rõ ràng”. Cái gọi là AI tiềm ẩn đề cập đến việc tích hợp AI vào các khả năng của hệ điều hành hiện có mà không thay đổi mô hình tinh thần của người dùng để cải thiện hiệu suất của các chức năng ban đầu, chẳng hạn như chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói, OCR và đọc màn hình nâng cao cũng như các khả năng trợ năng khác. Seager tin rằng những tính năng như vậy về bản chất giống những cải tiến quan trọng về khả năng tiếp cận hơn là chỉ đơn giản được gắn nhãn là "AI"; trong nhiều tình huống, chúng có thể được triển khai một cách hiệu quả thông qua các khung nguồn mở, mô hình trọng số mở và các phương pháp lý luận cục bộ, đồng thời tính đến tính chính xác và hiệu quả.

Một loại chức năng AI rõ ràng khác là các khả năng mới tập trung vào AI rõ ràng hơn. Chúng có thể bao gồm các quy trình công việc với một số khả năng nhất định của tổng đài viên, chẳng hạn như viết tài liệu, tạo ứng dụng, khắc phục sự cố tự động và thậm chí cung cấp các bản tóm tắt tin tức hàng ngày được cá nhân hóa. Tuy nhiên, Canonical cũng thừa nhận rằng những chức năng như vậy đi kèm với trách nhiệm bảo mật cao hơn nên phải thiết lập trước đầy đủ các cơ chế bảo mật, cách ly và kiểm soát quyền để ngăn chặn những tác dụng phụ không mong muốn. Theo cách nói của Seager, AI ngầm sẽ được sử dụng để nâng cao các tính năng hiện có của Ubuntu, trong khi AI rõ ràng sẽ dần được giới thiệu dưới dạng các tính năng mới.

Về mặt triển khai kỹ thuật cụ thể, Canonical có kế hoạch tiếp tục quảng bá "snap suy luận (gói Snap suy luận)" mà nó đã giới thiệu trước đây. Theo tuyên bố chính thức, loại Snap này cho phép người dùng dễ dàng gọi cục bộ hơn các khả năng suy luận mô hình được tối ưu hóa cho phần cứng cụ thể, giảm độ phức tạp của việc chuyển qua lại giữa Ollama, Ôm mặt và một số lượng lớn các mô hình định lượng. Ví dụ: sau khi người dùng cài đặt Snap suy luận, nếu nhà sản xuất chip có liên quan đã cung cấp khả năng tối ưu hóa thích ứng, hệ thống có thể tự động có được phiên bản mô hình phù hợp hơn với nền tảng phần cứng hiện tại. Ngoài ra, các Snap suy luận này phải tuân theo các quy tắc cách ly hộp cát giống như các Snap khác, giúp giảm nguy cơ mô hình có quyền truy cập bừa bãi vào dữ liệu gốc và tài nguyên hệ thống.

Seager cũng đề cập rằng trước đây, nếu muốn tận dụng tối đa khả năng của các mô hình lớn, bạn thường phải dựa vào các mô hình có kích thước tham số lớn hơn. Tuy nhiên, tiến trình mô hình gần đây đã chỉ ra rằng các mô hình cỡ nhỏ hoặc vừa đang tiếp tục nâng cao các khả năng nâng cao của chúng như gọi công cụ. Ví dụ: bài viết cho biết các mô hình mới như Gemma 4 và Qwen-3.6-35B-A3B đã chứng tỏ khả năng gọi công cụ và về mặt lý thuyết có thể được sử dụng để tìm kiếm các trang web, tương tác với các API và hệ thống tệp bên ngoài, khắc phục sự cố hệ thống theo thời gian thực và thực hiện lý luận về các chủ đề ngoài phạm vi của dữ liệu đào tạo ban đầu. Do đó, một trong những trọng tâm tiếp theo của Canonical là mở rộng đầu tư vào đội ngũ, theo dõi các phiên bản mẫu mới nhất càng sớm càng tốt và cung cấp các phiên bản được tối ưu hóa cho nhiều nền tảng chip nhất có thể.

Ngoài khả năng suy luận cơ bản, Canonical cũng đang hình dung ra một trải nghiệm hệ điều hành "nhận biết ngữ cảnh" hơn. Seager cho biết khi ngày càng nhiều người dùng quen với việc làm việc với các "đại lý", Ubuntu hy vọng sẽ mang đến những khả năng mạnh mẽ mà Linux đã tích lũy qua nhiều năm cho nhiều người hơn theo cách dễ hiểu và dễ sử dụng hơn. Các quan chức đang lên kế hoạch tích hợp quy trình làm việc dựa trên tác nhân vào Ubuntu, nhưng tiền đề vẫn phải phù hợp với thói quen sử dụng của nhóm người dùng Ubuntu và tôn trọng các giá trị riêng tư và bảo mật. Theo quan điểm của ông, cơ chế đóng gói hạn chế của Snap, cũng như nền tảng được Ubuntu đặt ra trong những năm gần đây để tích hợp các chức năng hệ thống cốt lõi, sẽ giúp Canonical đạt được mục tiêu này một cách an toàn hơn.

Hệ sinh thái máy tính để bàn Linux từ lâu đã nổi tiếng với sự phân mảnh. Sự phân mảnh này đã góp phần vào sự thịnh vượng của hệ sinh thái ở một mức độ nào đó, nhưng nó cũng thường làm phức tạp trải nghiệm tích hợp và khiến một số người dùng thất vọng. Canonical tin rằng nếu các mô hình lớn có thể được áp dụng cẩn thận ở cấp độ hệ thống, chúng có thể giúp người dùng hiểu một cách trực quan hơn về khả năng của các máy trạm Linux hiện đại, khiến máy tính để bàn Linux trở nên hấp dẫn hơn đối với nhiều người hơn.

Ý tưởng này không chỉ giới hạn ở máy tính để bàn. Seager đã đề cập rằng nếu bạn là kỹ sư về độ tin cậy của trang web (SRE) đang quản lý một số lượng lớn máy Ubuntu, thì mô hình lớn cũng có thể trợ giúp trong nhiều tình huống khác nhau, chẳng hạn như diễn giải nhật ký trong quá trình xử lý sự cố, tăng tốc phân tích nguyên nhân gốc hoặc thực hiện một loạt nhiệm vụ bảo trì theo kế hoạch trong các biện pháp bảo vệ nghiêm ngặt. Mục tiêu của Canonical là xây dựng một khung năng lực có thể thích ứng với các dạng thiết bị Ubuntu khác nhau, để các tác nhân có thể "hoạt động tự nhiên như các chức năng gốc của Ubuntu" trong các giao diện khác nhau. Ông nhấn mạnh rằng việc giao một số nhiệm vụ kỹ thuật về độ tin cậy của địa điểm cho các đại lý không nhất thiết có nghĩa là đưa ra một loại rủi ro mới, bởi vì môi trường sản xuất trưởng thành vốn dựa vào kiểm soát truy cập nghiêm ngặt, quy trình kiểm tra và sự tách biệt rõ ràng giữa quan sát và thực thi; điều Ubuntu hy vọng làm là cung cấp cho các tác nhân những khả năng cơ bản có thể hoạt động trong các ranh giới hiện có, chẳng hạn như phân tích chỉ đọc, quyền chi tiết và kiểm tra toàn diện các quyết định và kết quả.

Từ góc độ các tình huống sử dụng, chính thức hình dung rằng trong tương lai, người dùng có thể trực tiếp yêu cầu các thiết bị Linux của họ khắc phục sự cố kết nối Wi‑Fi hoặc tự động xây dựng một nền tảng phần mềm nguồn mở đã được định cấu hình trước, tăng cường bảo mật và có khả năng truy cập TLS. Trong các tình huống xa hơn, loại khả năng này thậm chí có thể trở thành lối vào cho các thiết bị khác kiểm soát máy chủ Linux. Phương thức tương tác có thể là ứng dụng di động, tin nhắn văn bản, lệnh thoại và các phương tiện khác.

Tất nhiên, Canonical cũng thừa nhận rằng khả năng suy luận cục bộ có liên quan chặt chẽ đến điều kiện phần cứng. Trong khi các công ty đang nỗ lực để giúp việc chạy các mô hình có trọng lượng mở trên phần cứng tiêu dùng thông thường trở nên dễ dàng hơn, thì các mô hình có kích thước thông số nhỏ hơn hiện không thể cạnh tranh trực tiếp với các mô hình lớn hơn trong nhiều tác vụ. Tuy nhiên, Seager tin rằng khoảng cách này phần lớn chỉ là vấn đề theo từng giai đoạn; Khi các nhà sản xuất chip toàn cầu tiếp tục phát triển phần cứng mới cho thị trường tiêu dùng với khả năng suy luận ngày càng tăng, những khả năng mà ngày nay dường như chỉ có thể thực hiện được với cơ sở hạ tầng AI tiên tiến sẽ dần trở nên phổ biến hơn trong những tháng và thậm chí những năm tới.

Ông cũng đặc biệt chỉ ra rằng khi thảo luận về AI, chúng ta không thể chỉ nhìn vào hiệu suất mà còn phải xem xét đến hiệu quả. Mặc dù người dùng có thể dễ dàng so sánh trực tiếp tốc độ tạo mã thông báo của các mô hình đám mây lớn với hiệu suất của các thiết bị cục bộ, mức tiêu thụ điện năng của máy gia tốc gốc cục bộ cũng sẽ giảm đáng kể khi xử lý khối lượng công việc như vậy, điều đó cũng có nghĩa là ngưỡng sử dụng dự kiến ​​sẽ giảm hơn nữa. Canonical dự đoán rằng tất cả những điều này sẽ không thể hoàn thành trong một sớm một chiều, nhưng Ubuntu hy vọng sẽ sẵn sàng khi điều kiện chín muồi và sự hợp tác với các nhà sản xuất chip cũng như công việc thích ứng liên quan sẽ đóng vai trò ngày càng quan trọng.

Tổng hợp lại, tín hiệu mà Canonical đưa ra rất rõ ràng: Ubuntu không có ý định biến mình thành một "sản phẩm AI", nhưng hy vọng sẽ dần dần giới thiệu các khả năng của AI trong các phiên bản tương lai một cách thận trọng hơn, dễ kiểm soát hơn và phù hợp hơn với các giá trị nguồn mở. Các quan chức cho biết trong suốt năm 2026, nhóm sẽ làm việc xoay quanh mục tiêu "cho phép người dùng Ubuntu truy cập AI tiên tiến một cách thận trọng, an toàn và tuân thủ nguồn mở". Trọng tâm bao gồm đào tạo kỹ sư, lý luận hiệu quả cục bộ, cải tiến khả năng truy cập và trải nghiệm hệ điều hành nhận biết ngữ cảnh hơn.