Altman đích thân phong ấn GPT-5.5 là “Thiên tài tự kỷ” và nhóm 16 thành viên đã hủy đăng ký Claude

Vừa rồi Ultraman đã đích thân đặt cho GPT-5.5 một biệt danh gây chấn động toàn mạng - "Thiên tài tự kỷ". Nửa tháng sau khi GPT-5.5 lên mạng, Ultraman đã nhiều lần bày tỏ sự phấn khích của mình trên nền tảng xã hội. Anh ấy không khỏi thở dài, tôi không thể tin được chúng tôi thực sự đã tạo ra một AI như vậy!

T AGPH61

Theo cách nói của Ultraman, “trí thông minh ban đầu” của GPT-5.5 đã mở rộng khoảng cách cấp độ lỗi:

Điểm chạy rất áp đảo, số tiền tiết kiệm được mã thông báo tăng vọt và tính thẩm mỹ của hiệu suất và bạo lực là đầy đủ.

Các ông lớn trong giới AI đã bỏ phiếu cho GPT-5.5 bằng đôi chân của mình. Ngay cả giáo sư AI Derya Unutmaz cũng thẳng thắn nói rằng nó chắc chắn có thể được gọi là GPT-6!

Cùng ngày, một biểu đồ đã lan truyền trên toàn bộ Internet. Số lượt tải xuống Codex được hỗ trợ bởi GPT-5.5 đã tăng vọt trong tháng 5, với 86,1 triệu vượt xa Claude Code.

Chỉ trong tuần trước, số lượt tải xuống đã vượt quá 90 triệu, gấp 12 lần so với Claude Code.

Đồng thời, phản hồi từ các nhà phát triển cũng rất điên cuồng để xác minh điều này.

Nhiều người đã công khai tuyên bố rằng hiệu suất của GPT-5.5 đã vượt qua Claude Opus 4.7 trong các tác vụ mã hóa thực tế, đặc biệt là mức tiêu thụ mã thông báo.

Đối với cùng một nhiệm vụ, GPT-5.5 sử dụng mã thông báo ít hơn gần 40% so với Claude.

Phải nói rằng phép ẩn dụ về "thiên tài tự kỷ" chính xác đến mức khiến người ta cảm thấy có chút đau khổ.

16 Nhóm nhân sự đã hủy đăng ký Claude và tiết kiệm được 32.000 USD mỗi tháng

Một công ty khởi nghiệp Bold Morgan Linton, người sáng lập Metrics, đã đăng một bài đăng với giọng điệu bình tĩnh nhưng nội dung bùng nổ:

Chính thức chia tay Anthropic!

Đối với nhóm kỹ thuật nhỏ gồm 16 người của tôi, sự kết hợp giữa Codex + Cursor đã thay thế hoàn toàn giải pháp ban đầu.

Lý do rất đơn giản và thô thiển, Claude Code đắt quá!

Ngược lại, với sự hỗ trợ của GPT-5.5, hiệu suất gần đây của Codex rất đáng kinh ngạc và tỷ lệ sử dụng mã thông báo cực kỳ cao, rất tiết kiệm chi phí.

Trong công việc thực tế, Bold Metrics vẫn thường xuyên sử dụng Con trỏ để xem lại mã.

Điều quan trọng nhất là việc sử dụng Con trỏ của nhóm cho đến nay chưa bao giờ gây ra các hạn chế về bảng và chức năng Composer 2 tích hợp sẵn của nó đủ để xử lý hầu hết các tình huống phát triển.

Đối với việc tiêu thụ Claude Token, Linton đã tính một tài khoản -

Mỗi kỹ sư sẽ đốt hơn 2.000 đô la Mỹ cho mỗi lần tháng và 16 người sẽ chi hơn 32.000 đô la Mỹ mỗi tháng.

Sau khi chuyển sang Codex + Cursor, hiệu quả của mã thông báo của GPT-5.5 đã giảm đáng kể chi phí mà không ảnh hưởng đến hiệu suất.

TAGP H128

Điều đáng lo ngại hơn nữa là dự đoán của ông rằng ngày càng có nhiều lãnh đạo kỹ thuật sẽ đưa ra những quyết định tương tự.

Phải nói là bài viết này giống như một quả bom sâu, đánh thẳng vào cổng đời của Anthropic——Sản phẩm tốt, nhưng việc tiêu thụ mã thông báo chỉ đơn giản là để lấy tiền.

Còn Codex thì sao? Dữ liệu đã cung cấp câu trả lời.

Với 90 triệu lượt tải xuống trong một tuần, Codex đã trở thành huyền thoại

Dữ liệu của TickerTrends cho thấy tính đến ngày 3 tháng 5, Codex đã được tải xuống một con số đáng kinh ngạc là 86,1 triệu lần, tăng 1397% hàng tuần.

Vào ngày 8 tháng 5, con số này tiếp tục tăng lên 90 triệu chỉ trong một tuần.

Đồng thời, Claude Code của Anthropic đã được tải xuống 7,2 triệu lần trong cùng thời gian, giảm 38% so với cùng kỳ tuần trước.

Một người đang chạy đua và một người đang mất máu. Tốc độ lên xuống của dòng chảy thật ngột ngạt.

Điểm bùng phát của làn sóng tăng trưởng này đã rõ ràng——

Vào ngày 30 tháng 4, Codex đã phát hành phiên bản v0.128.0, giới thiệu một quy trình làm việc liên tục/mục tiêu và hỗ trợ lập kế hoạch nhiệm vụ nhiều bước trong các phiên.

Cùng với bối cảnh hàng triệu Token do GPT-5.5 mang lại và cải thiện hiệu quả Token 40%, các nhà phát triển đã bỏ phiếu bằng đôi chân của mình một cách trung thực hơn bất kỳ đánh giá nào.

Bản thân Ultraman đã dùng một từ để mô tả sự phát triển của Codex trong một bức thư nội bộ: điên rồ!

Phó chủ tịch Microsoft Omar Shahine không thể không khen ngợi: “Codex đã hoạt động rất xuất sắc trong việc tạo ra các ứng dụng Swift iOS”.

Anh ấy chỉ sử dụng một lời nhắc và Codex đã truy cập trực tiếp vào ứng dụng, giải quyết được 95% công việc. Nó dễ sử dụng hơn nhiều so với Claude Code.

Tiếp theo, Romain, Trưởng bộ phận Trải nghiệm nhà phát triển tại OpenAI Huet cho biết -

Codex có thể thiết kế giao diện, sử dụng GPT-5.5 để viết mã Swift, bạn có thể chạy ứng dụng trực tiếp trong trình mô phỏng mà không cần mở Xcode và thậm chí bạn có thể sử dụng "điều khiển máy tính" để kiểm tra ứng dụng ở mọi nơi!

Nhà phát triển Dimitris Papailiopoulos cũng nói rằng rõ ràng ông tin tưởng Codex hơn.

Bây giờ, với Codex, Ultraman nói rằng thời gian của anh ấy tự do hơn.

TAGP H64"sự thật" của Ultraman vào đêm khuya, Khu vực bình luận đã vượt khỏi tầm kiểm soát

Cũng hôm nay, Allman bắt đầu thu thập ý kiến trực tuyến, "Bạn muốn mô hình thế hệ tiếp theo của OpenAI cải thiện điều gì nhất?"

Có một thời gian, khu vực bình luận tràn ngập các đề xuất.

Một bình luận khen ngợi đã đóng đinh OpenAI vào tường

Câu trả lời của cựu nhà nghiên cứu OpenAI Will Depue đã trở thành tâm điểm của khán giả.

GPT-5.5 thu hẹp khoảng cách với Claude, nhưng lại thua hoàn toàn ở "sự đụng chạm của con người".

Anh ấy đưa ra một ví dụ. Khi bạn muốn học vật lý thiên văn, GPT-5.5 sẽ ngay lập tức đưa ra một loạt các từ viết tắt và công thức lạnh lùng, khiến bạn bối rối. Bối rối;

Và Claude giống như một gia sư hiểu biết và tao nhã, người có thể dẫn bạn vào hố thỏ với nhiều kiến thức đa dạng, thú vị và không lộn xộn.

Không chỉ vậy, anh còn hét lên rằng việc điều chỉnh dữ liệu của OpenAI quá máy móc nên nhanh chóng học hỏi từ Anthropic và rút "tính cách" cũng như "sức mạnh giải thích" của mô hình xuống 30%.

Người mẫu mạnh nhất trên Internet thực ra lại bị người khác không thích vì "trông giống con người".

Những người khác hy vọng ChatGPT có thể cải thiện khả năng làm theo hướng dẫn và viết.

Ngoài ra, giao diện người dùng được cư dân mạng nhắc đến nhiều nhất và tôi hy vọng sẽ thấy những cải tiến đáng kể.