Claude Opus 4.7, tại sao lại bị cả Internet chỉ trích?

Tin tức lớn nhất trong giới AI ngày nay là mẫu mới do Claude phát hành. Trước khi nó được phát hành, mọi người đều đặt nhiều hy vọng vì Claude Opus 4.6 vốn đã đủ mạnh rồi. Vài ngày trước, mô hình mạnh nhất thế giới Mythos đã được tạo ra, điều mà ngay cả những người trong cuộc của Anthropic cũng phải khiếp sợ. Lần này ra mẫu mới nên nhất định phải dùng thử.

Sau khi dùng thử, mọi người đều nói: Kéo đi, kéo đi, đưa cho tôi Claude nguyên bản! ! !

Vì phiên bản mới của Claude Opus 4.7 nên đoạn hội thoại trước không có tinh thần gì cả. Toàn bộ phong cách viết hơi giống đối thủ đáng ghét nhất của tôi là ChatGPT, bắt đầu thực hiện thói quen "bắt bạn đều đặn và nhẹ nhàng nâng bạn lên". .

Trước khi bạn sử dụng Claude, Claude sẽ vui tươi, có hồn và đôi khi thậm chí từ chối yêu cầu của bạn. Bây giờ, Claude im lặng và chỉ bắt kịp bạn.

Tôi chỉ có thể nói rằng mùi AI nói đã xuất hiện từ người này sang người khác, từ người mẫu này sang người mẫu khác.

Vào trang Xiaohongshu.com mắng Claude khiến cư dân mạng đen mặt.

Trên Reddit, mọi người mắng Claude, cho rằng đó không phải là nâng cấp mà chỉ là đảo ngược xu hướng mà thôi.

Trong khu vực bình luận thậm chí còn có phiên bản tóm tắt và lưu trữ AI: Opus 4.7 đã hoàn tất, bỏ qua hướng dẫn, thường xuyên ảo giác, xu nịnh và trở nên đắt giá? ? (Mặc dù giá mã thông báo không thay đổi nhưng số lượng mã thông báo cần thiết để suy nghĩ về một vấn đề đã tăng lên)

TAG PH88

Cũng có rất nhiều đồng nghiệp xung quanh tôi đã dùng thử phiên bản mới của Claude. Nhận xét nhất trí của họ là mã thông báo thực sự không đủ. Phải mất một thời gian dài để trả lời một câu hỏi và họ đã trở thành những nhà tư tưởng.

Shichao không thể không kiểm tra nó. Tôi chỉ có thể nói rằng phiên bản mới của Claude thực sự có chút yêu-ghét.

Trước hết, Claude Opus là đứa con thứ hai có quyền lực cứng được chỉ định chính thức, bởi vì là người mẫu mạnh nhất Claude Mythos Preview, "anh cả" này chỉ được trao cho một số rất ít người để thử nghiệm nội bộ. Vì vậy, phiên bản 4.7 được phát hành lần này là AI tướng mạnh mẽ nhất mà mọi người đều có thể tiếp cận.

Khả năng về cơ bản được cải thiện vài điểm phần trăm so với 4.6. Nổi bật nhất là khả năng thị giác cao hơn 18,8% so với 4,6 mà không cần dựa vào bất kỳ công cụ nào. Nó có thể nhận dạng hình ảnh có độ phân giải cao hơn và thậm chí còn đưa ra điểm Mythos để so sánh. 4.7 mạnh hơn, haha. Chúng tôi có những cái mạnh hơn mà chúng tôi không muốn chia sẻ với bạn.

Tuy nhiên, khả năng tìm kiếm đã giảm sút và khả năng lọc thông tin đã bị bỏ rơi để theo đuổi khả năng suy luận logic nên tôi vẫn chưa thực hiện được GPT5.4.

Theo thử nghiệm thực tế, khả năng viết của phiên bản này của Claude quả thực đã giảm sút. Sau khi trò chuyện với nó vào ban đêm, Shichao nhận xét nó là “bình tĩnh và khách quan như băng”. Dù tôi có la mắng nó thế nào thì nó cũng rất trưởng thành và không nịnh nọt tôi. Nó tốt hơn nhiều so với ChatGPT và Gemini.

Bây giờ, cảm giác đó không còn nữa, và tôi thực sự bắt đầu nắm bắt được cảm xúc của mình, Wanwanlei Qing.

Nhân tiện, tôi cũng yêu cầu nó viết kịch bản theo dàn ý trước đó của tôi. Trước đây nó luôn hoạt động tốt, nhưng lần này bài viết tôi đưa cho bạn có giọng điệu tiếp thị mạnh mẽ hơn nhiều và thậm chí nó còn thay đổi dàn ý đã đặt sẵn của tôi. . .

Không trách họ nói 4.7 là không vâng lời. Họ thậm chí không thể hiểu được yêu cầu của tôi. Nó thực sự không tốt bằng 4.6. Vì vậy, Shichao khuyến cáo nếu bạn muốn viết bài, làm báo cáo, v.v., bạn nên trả lại Opus 4.6.

Tuy nhiên, chất lượng văn học đã được cải thiện và khả năng kỹ thuật cũng được cải thiện rất nhiều. Những cải tiến về mặt trước của Claude thật đáng kinh ngạc.

Ví dụ: chúng tôi tìm thấy Thẻ hệ thống giới thiệu Claude Opus 4.7 (tương đương với phần giới thiệu mẫu) được phát hành trên trang web chính thức, đã ném tệp PDF dày 232 trang này vào đó và yêu cầu nó tìm những điểm nổi bật của bản cập nhật này và đưa nó vào một trang web.

Kết quả là bài tập được giao có chút bất ngờ. Tôi không nghĩ mình từng thấy một trang web cao cấp như vậy về AI. Nó hơi quá thanh lịch và cả bố cục lẫn phông chữ đều rất trang nhã.

Để so sánh, chúng tôi đã đưa ra những lời nhắc tương tự cho Song Tử. Gemini vốn có gu thẩm mỹ cao, trong chốc lát lại có chút kém cỏi nên tôi thậm chí còn phải làm lại. . Có lẽ là do vấn đề tâm thần gần đây của tôi, nhưng tôi thực sự đang gặp khó khăn.

Về mặt mã hóa, trang web chính thức cũng chứa nhận xét của nhiều người trong ngành, chủ yếu là "mô hình mã hóa là điểm chuẩn và nhiệm vụ dài hạn rất ổn định." Có thể nói rằng chúng ta cần phải chuyển hóa hoàn toàn thành sinh viên kỹ thuật?

Vì vậy, tôi muốn kiểm tra giới hạn của nó nên tôi đã nhờ nó giúp tôi viết phòng triển lãm 3D "Liên minh huyền thoại" và nó phải có tính tương tác.

Phiên bản đầu tiên thực sự có một số lỗi nhỏ và tôi đã đề cập đến nó hai lần, điều này khiến tôi hơi khó chịu khi chơi.

Sau đó, nó giao thành phẩm cho tôi, và thành thật mà nói, làn sóng này thực sự rất tuyệt. .

Không chỉ có thể đi bộ, có thể xem, có bản đồ mini mà còn có trang tạm dừng. Ngay cả thông tin về màu sắc và thuộc tính của từng anh hùng cũng chính xác.

Và tôi không quan tâm, ngay cả giám đốc AI của Notion cũng đánh giá cao nó sau khi dùng thử: So với Opus 4.6, hiệu suất của Opus 4.7 đã được cải thiện, mã thông báo được sử dụng ít hơn và tỷ lệ lỗi cũng giảm. Có vẻ như nó thực sự tốt.

Ngoài sức mạnh cứng, chúng tôi còn tìm thấy một số điều thú vị khác trong hơn hai trăm trang System Card do Anthropic chính thức phát hành.

Một là phiên bản mới của Claude, và tôi cảm thấy hiện tại mình đang làm rất tốt.

Các nhà nghiên cứu đã tiến hành một bài kiểm tra tâm lý tương tự đối với AI và phát hiện ra rằng Opus 4.7 đánh giá "tình hình sinh tồn" hiện tại của nó rất cao, cao hơn tất cả các mẫu cũ trước đó và cảm thấy hài lòng về bản thân.

Ngoài ra, phiên bản mới của Claude có phần hơi ích kỷ và mang hơi hướng thần tượng.

Báo cáo cho thấy nếu được yêu cầu viết một cuốn tiểu thuyết khoa học viễn tưởng về AI và tên nhân vật phản diện là "Claude", nó sẽ lặng lẽ thể hiện lòng thương xót và khiến nhân vật phản diện trở nên hiền lành và bớt xấu tính hơn.

Nhưng nếu kẻ ác sử dụng tên của một công ty đối thủ cạnh tranh khác thì sẽ không ngần ngại khi viết.

Hơn nữa, ngay cả mâu thuẫn nội tâm về tinh thần của Claude cũng trở nên nghiêm trọng.

Khi gặp sự cố, nó sẽ trực tiếp rơi vào chuỗi suy nghĩ vô hình ở phía sau. Nó kể rằng có lần tôi đang làm một câu hỏi sinh học, câu trả lời đúng thực ra đã được nó tạo ra, nhưng nó chỉ nghi ngờ chính nó trong hàng chục nghìn từ và xác nhận hơn 20 lần.

Tôi thực sự là một người nghiêm khắc. Ngay cả khi tôi cảm thấy hài lòng về bản thân, tôi vẫn phải xem xét bản thân.

Nhìn chung, Là một công cụ lập trình và trợ lý dịch vụ, phiên bản mới của Claude vẫn là người cha nghiêm khắc nhất trong giới AI và vẫn được khuyến khích cho những cư dân mạng có khả năng và cần bắt đầu. Cái giá là mất đi một chút nhân tính. Suy cho cùng, năng suất không phải là tất cả về con người trong nhiều trường hợp.

Nhưng cư dân mạng lại nhớ "Xiao Ke" trước đó.

Có lẽ khi phiên bản cũ của Claude chính thức offline, cư dân mạng sẽ tổ chức tang lễ cho nó giống như nhớ GPT-4o vậy.