Đồng nghiệp được “tinh luyện” thành Kỹ năng? Mọi người đều làm điều này simple

Dự án GitHub "Coleague.Skill" đã trở nên phổ biến. Sau đó là "boss.Skill" và "tiền thân.Skill". Có vẻ như mọi người xung quanh bạn đều có thể được Skill biến thành người kỹ thuật số. Bên bạn 24/7. Một số phương tiện truyền thông cho rằng nó có thể "tái tạo một cách hoàn hảo giọng điệu và tư thế đổ lỗi của đồng nghiệp", trong khi những phương tiện truyền thông khác cho rằng nó có thể "thay thế hoàn toàn đồng nghiệp của bạn".

Thành thật mà nói, lần cuối cùng tôi nhìn thấy một thứ cyberpunk như vậy là câu chuyện nền về chủng tộc Necron trong "Warhammer 40K".

Có lẽ nào tôi đã du hành xuyên thời gian?

Tôi đã xem xét điện thoại và mọi thứ đều ổn.

Vì vậy, tôi đã sắp xếp lại toàn bộ sự việc ngay từ đầu, và cuối cùng tôi phát hiện ra rằng bản thân sự việc chỉ là một trò đùa trong giới kỹ thuật, nhưng nó ngày càng trở nên nghiêm trọng khi được lan truyền.

Điều này không khó hiểu. Ngày nay, khi mọi người đều lo lắng về việc bị thay thế bởi AI, nỗi lo lắng còn lan rộng hơn cả sự thật.

Cái gọi là "Tinh chỉnh đồng nghiệp" thực chất là một trình thu thập thông tin cộng với mẫu từ nhắc nhở

Đồng nghiệp. Kỹ năng Dự án này rất đơn giản.

Trong thư mục đồng nghiệp, mỗi "đồng nghiệp kỹ thuật số" là một thư mục con có một số tệp Markdown trong đó: Skill.md là mục nhập chính, work.md mô tả công việc, Persona.md mô tả tính cách và meta.json là được thêm vào để lưu trữ siêu dữ liệu. Thế thôi.

Tất cả thông tin được tóm tắt thành nhiều tệp văn bản tĩnh, thay vì sử dụng cơ sở dữ liệu vectơ để truy xuất ngữ nghĩa và không liên quan đến bất kỳ hoạt động đào tạo mô hình nào.

Quy trình làm việc cũng đơn giản. Dự án

cung cấp một số tập lệnh Python, trong đó feishu_auto_collector.py được sử dụng để ghi lại các tin nhắn và tài liệu của Feishu, dingtalk_auto_collector.py được sử dụng để thu thập dữ liệu DingTalk, wechat_parser.py phân tích các bản ghi trò chuyện WeChat và email_parser.py xử lý email.

Công việc của những tập lệnh này là thu thập dữ liệu và chuyển đổi định dạng, đồng thời văn bản gốc được sắp xếp thành một định dạng thống nhất. Sau đó, đưa đống văn bản này cho AI, để nó tóm tắt "khả năng làm việc" và "đặc điểm tính cách" của một người và tạo ra các tệp Markdown đó.

dễ chạy hơn.

Khi bạn gọi Kỹ năng này, Claude sẽ đọc các tệp Markdown tĩnh đó dưới dạng ngữ cảnh, sau đó nói chuyện với bạn theo phong cách được mô tả.

Giống như việc bạn đưa cho một diễn viên một kịch bản và nói với anh ấy rằng "Bây giờ bạn sẽ vào vai một người quản lý sản phẩm, người thích sử dụng dấu chấm than khi nói chuyện và thường đổ lỗi cho bộ phận kiểm tra". Diễn viên chỉ có thể hành động phù hợp.

Đồng nghiệp. Skill về cơ bản là một dự án kỹ thuật từ + trình thu thập thông tin nhanh chóng tuân theo tiêu chuẩn AgentSkills. Nó hoàn toàn không phải là một dự án đào tạo AI chứ đừng nói đến sự bất tử trên mạng.

"Cấu trúc tính cách năm cấp độ" trong dự án có tồn tại nhưng nó chỉ là sự sắp xếp của các từ nhắc nhở. Nó không phải là một bản phân tích kỹ lưỡng về cách suy nghĩ và kiến thức của một người, cũng không có công nghệ bí ẩn nào trong đó. Tệp

persona.md chia mô tả tính cách thành 5 lớp: Lớp 0 là các quy tắc cứng, có mức ưu tiên cao nhất; Lớp 1 là nhận dạng danh tính, chẳng hạn như "Tôi là kỹ sư giao diện người dùng"; Lớp 2 là kiểu biểu đạt, chẳng hạn như "nói ngắn gọn, không có biểu tượng cảm xúc"; Lớp 3 là chế độ ra quyết định, chẳng hạn như “có xu hướng thận trọng khi gặp phải các lựa chọn kỹ thuật”; Lớp 4 là hành vi giữa các cá nhân, chẳng hạn như “không tích cực tham gia vào các cuộc tranh luận”.

Đồng nghiệp. Quy tắc vận hành kỹ năng cũng được viết rõ ràng. Đầu tiên, phần nhân cách xác định thái độ thực hiện nhiệm vụ, sau đó phần công việc sử dụng các kỹ năng kỹ thuật để hoàn thành nhiệm vụ. Kiểu biểu thức do cá nhân xác định luôn được duy trì trong quá trình xuất.

Phân tích cuối cùng chỉ là viết hướng dẫn nhập vai chi tiết cho Claude.

Vấn đề đầu tiên do thiết kế này gây ra là bộ nhớ.

Những Kỹ năng này không có hệ thống trí nhớ liên tục. Mỗi cuộc trò chuyện sẽ đọc lại các tệp Markdown tĩnh đó và sẽ không tìm hiểu cũng như cập nhật dựa trên các tương tác mới.

Những gì bạn đã trò chuyện với nó sẽ bị lãng quên vào lần tiếp theo bạn gọi Kỹ năng này. Nó không nhớ giải pháp kỹ thuật nào bạn đã thảo luận ngày hôm qua, nó không biết dự án đang ở đâu và nó sẽ không điều chỉnh cách trả lời dựa trên phản hồi của bạn. Có một câu trong README của dự án

rất chân thực: “Chất lượng nguyên liệu quyết định chất lượng tay nghề”.

Trong giới máy tính có một câu nói tên là GIGO, toàn văn là Garbage In, Garbage Out. Bản dịch là rác vào, rác ra, ám chỉ những gì đồng nghiệp đã đề cập trong Skill.

Nếu đồng nghiệp cũ của bạn không thích gửi tin nhắn và lịch sử trò chuyện chứa đầy “đã nhận”, “ok” và “1”, thì Kỹ năng được tạo về cơ bản là lặp lại. Một ví dụ khác, có rất ít cuộc thảo luận kỹ thuật trong lịch sử trò chuyện và hầu hết đều trò chuyện và phàn nàn. Vậy thì Kỹ năng này chỉ có thể cùng bạn trò chuyện và phàn nàn.

Việc này vẫn chưa kết thúc. Vì đây là vai trò bạn đặt ra cho hình mẫu nên AI sẽ trải qua sự trôi dạt về tính cách trong quá trình tương tác lâu dài, tức là nó sẽ dần đi chệch khỏi tính cách mặc định.

Điều này là do khi số vòng đối thoại tăng lên và cửa sổ ngữ cảnh chứa đầy nội dung đối thoại mới, sức nặng của các từ gợi ý xác định tính cách ban đầu sẽ bị giảm bớt trong toàn bộ bối cảnh và mô hình sẽ dần dần "quên" vai trò của nó.

Và kỹ năng của người đồng nghiệp này không thể chắt lọc được “kiến thức chuyên môn và logic phán đoán”.

Hiện tượng "nghịch lý chuyên gia" sẽ xảy ra trong AI trong quá trình biểu diễn. Nghĩa là, bạn càng để AI đóng vai trò hiểu biết công nghệ và kiến thức thì nó sẽ càng đưa ra những câu trả lời sai.

Bởi vì sau khi AI được yêu cầu hoạt động như một chuyên gia, AI trước tiên sẽ bắt đầu bắt chước biểu cảm, giọng điệu và thậm chí một số thói quen nghề nghiệp của chuyên gia. Tuy nhiên, những hạn chế bổ sung này cản trở việc mô hình đánh giá vấn đề.

Đồng nghiệp.Skill, sếp.Skill, người tiền nhiệm.Skill, họ chỉ có thể rút ra được những thứ hời hợt nhất.

Có thể trích xuất các câu thần chú và thói quen diễn đạt, chẳng hạn như "Tôi quen bắt đầu bằng 'ừm hmm'" và "Tôi thích sử dụng dấu chấm lửng". Có thể trích xuất các ngăn xếp công nghệ và công cụ thường được sử dụng, chẳng hạn như "quen thuộc với React và TypeScript". Có thể trích xuất các quy trình công việc rõ ràng, chẳng hạn như "chạy thử nghiệm đơn vị trước khi gửi mã".

Nhưng nó không thể đưa ra phán đoán trong những tình huống phức tạp.

Khi một vấn đề kỹ thuật chưa từng gặp phải trước đây phát sinh và cần phải cân nhắc nhiều yếu tố như hiệu suất, chi phí và thời gian phát triển, Kỹ năng này không thể đưa ra những gợi ý thực sự có giá trị.

Nó không thể rút ra được các kỹ năng giải quyết vấn đề sáng tạo. Các kỹ sư thực sự sẽ đưa ra những giải pháp thông minh khi gặp nút thắt cổ chai, nhưng Skill chỉ có thể lặp lại những khuôn mẫu mà nó đã thấy.

Nó không thể rút ra trực giác dựa trên nhiều năm kinh nghiệm. Những người có kinh nghiệm sẽ mơ hồ cảm thấy “có thể có một cái hố ở đây” khi nhìn thấy một đoạn mã, nhưng trực giác này không thể được ghi lại bởi một số tệp Markdown.

nói rằng Kỹ năng này có thể "viết mã bằng cách sử dụng các thông số kỹ thuật của nó", điều này chỉ đúng một nửa.

Nó thực sự có thể xuất ra các đoạn mã phù hợp với một phong cách nhất định, chẳng hạn như tuân theo các quy ước đặt tên và định dạng mã cụ thể.

Nhưng khi phải đưa ra các quyết định về kiến trúc thực sự cần phải đưa ra, chẳng hạn như có nên giới thiệu nhóm công nghệ mới hay không, cách thiết kế khả năng mở rộng của hệ thống và cách cân bằng nợ kỹ thuật và nhu cầu kinh doanh, nó chỉ có thể đưa ra các đề xuất mơ hồ hoặc đơn giản lặp lại các câu trả lời tiêu chuẩn thấy trong dữ liệu đào tạo.

Trong phân tích cuối cùng, đây là một Kỹ năng rất chu đáo chỉ ra cách gói gọn "nhân cách" một cách có cấu trúc.

Nó giống như một chatbot có cá tính hoặc nhật ký công việc thông minh. Có lý khi coi nó như một công cụ phụ trợ cho việc kế thừa tri thức.

Nhưng nếu bạn thực sự nghĩ rằng nó có thể thay thế một người thì bạn đã nhầm.

Điều này thực sự là bất hợp pháp

Đồng nghiệp. Kỹ năng được viết rõ ràng trong mô tả dự án. Bạn cần cung cấp tin nhắn Feishu, tài liệu DingTalk và email của đồng nghiệp.

Có những rủi ro pháp lý rất lớn đằng sau bản án này.

Cốt lõi của vấn đề nằm ở quyền sử dụng dữ liệu sau khi rời công ty.

Điều 13 của "Luật bảo vệ thông tin cá nhân" quy định rằng việc xử lý thông tin cá nhân cần phải đáp ứng một trong một số điều kiện: có được sự đồng ý của cá nhân, cần thiết để ký kết và thực hiện hợp đồng, cần thiết để thực hiện nghĩa vụ pháp lý hoặc nghĩa vụ pháp lý, nhằm ứng phó với các trường hợp khẩn cấp về sức khỏe cộng đồng và xử lý thông tin cá nhân được tiết lộ trong phạm vi hợp lý.

Tình hình hiện tại là nhân viên đã nghỉ việc và chấm dứt hợp đồng lao động. Công ty tiếp tục sử dụng dữ liệu từ công việc của anh ấy để "tinh chỉnh" anh ấy thành một nhân cách kỹ thuật số. Cái này thuộc cái nào?

Câu trả lời là không có câu trả lời nào trong số đó.

Không có ủy quyền mới nào được nhận từ nhân viên sắp rời đi vì trong hầu hết các trường hợp, không ai hỏi anh ta cả. Hợp đồng lao động đã bị chấm dứt và không còn “cần thiết để thực hiện hợp đồng” vì mối quan hệ hợp đồng đã chấm dứt và không có cơ sở hợp đồng để tiếp tục sử dụng dữ liệu.

Việc sử dụng dữ liệu để đào tạo AI vượt quá phạm vi hợp lý của các điều khoản, bởi vì kỳ vọng hợp lý của nhân viên khi gửi tin nhắn công việc là để giao tiếp trong công việc chứ không được sử dụng để đào tạo AI.

Những người vi phạm Đạo luật bảo vệ thông tin cá nhân có thể phải đối mặt với lệnh cải chính, cảnh cáo, tịch thu các khoản lợi bất hợp pháp và phạt tiền.

Những người vi phạm chung sẽ bị yêu cầu cải chính, cảnh cáo và tịch thu số tiền thu được bất hợp pháp. Những người từ chối sửa chữa sẽ bị phạt không quá 1 triệu nhân dân tệ.

Nếu tình tiết nghiêm trọng, cơ quan quản lý từ cấp tỉnh trở lên sẽ phạt dưới 50 triệu nhân dân tệ hoặc dưới 5% doanh thu của năm trước. Đồng thời, họ có thể bị yêu cầu đình chỉ hoạt động kinh doanh liên quan, đình chỉ hoạt động để khắc phục và thu hồi giấy phép liên quan, v.v.

Rắc rối hơn nữa là thông tin nhạy cảm.

Bản ghi trò chuyện công việc không chỉ bao gồm nội dung công việc mà còn có thể bao gồm tình trạng sức khỏe cá nhân, chẳng hạn như "Hôm nay tôi cảm thấy không khỏe, vui lòng xin nghỉ phép"; điều kiện gia đình như “con ốm, tôi phải về sớm”; thông tin tài chính như “tháng này vay thế chấp căng thẳng”; và các mối quan hệ giữa các cá nhân, chẳng hạn như đánh giá của các đồng nghiệp khác.

Đây là những thông tin cá nhân nhạy cảm.

Điều 28 của Đạo luật bảo vệ thông tin cá nhân quy định rằng việc xử lý thông tin cá nhân nhạy cảm cần có sự đồng ý riêng của cá nhân.

Lưu ý rằng đây là “sự đồng ý của cá nhân” và không nằm trong thỏa thuận sử dụng dữ liệu chung được ký khi gia nhập công ty.

Nhưng liên kết này hoàn toàn bị thiếu trong quy trình vận hành của các dự án Kỹ năng này. Họ chỉ sử dụng trình thu thập thông tin để chuyển đổi tất cả các bản ghi trò chuyện sang định dạng Markdown rồi cung cấp chúng cho AI, bất kể nội dung trong đó là gì.

Điều này có nghĩa là Kỹ năng được “tinh chỉnh” của mọi đồng nghiệp đều có thể đã vi phạm các quy định bảo vệ thông tin nhạy cảm. Và hành vi vi phạm này không phải xảy ra một lần mà nó đang diễn ra liên tục. Bởi vì mỗi khi bạn gọi Kỹ năng này là bạn đang xử lý thông tin nhạy cảm này.

Bạn có nghĩ đây là kết thúc không? Dự án

yêu cầu người dùng cung cấp dữ liệu trò chuyện WeChat và cũng đề xuất ba công cụ cho dự án.

Theo "Thỏa thuận dịch vụ và giấy phép phần mềm Tencent WeChat", việc sao chép, đọc và phát triển dữ liệu phái sinh trong quá trình hoạt động của WeChat mà không có sự cho phép bằng văn bản của Tencent là vi phạm.

Điều 45 của "Luật bảo mật dữ liệu" quy định rằng mọi hành vi vi phạm nghĩa vụ bảo vệ bảo mật dữ liệu dẫn đến hậu quả nghiêm trọng như rò rỉ dữ liệu, cấu thành tội phạm, sẽ bị điều tra trách nhiệm hình sự theo quy định của pháp luật.

Đây không phải trò đùa, việc rò rỉ dữ liệu của công ty phải chịu trách nhiệm hình sự.

Nhiều người có thể nghĩ rằng đây chỉ là một "công việc trọn vẹn" và sẽ không có ai thực sự theo đuổi nó.

Nhưng "có được một công việc tốt" không bao giờ là miễn phí cho tất cả mọi người. Nếu một công ty thực sự bắt đầu sử dụng phương pháp này để "giữ chân" những nhân viên đã nghỉ việc thì hãy chuẩn bị khởi kiện.

Nếu nhân viên nghỉ việc phát hiện mình đã bị "tinh luyện", anh ta có thể khiếu nại lên các bộ phận liên quan và yêu cầu công ty xóa dữ liệu liên quan và bồi thường thiệt hại.

Công ty đã tiết lộ bí mật thương mại hoặc thông tin về các nhân viên khác và cũng có thể phải đối mặt với các vụ kiện tập thể từ các nhân viên khác. Nếu cơ quan quản lý mở vụ án để điều tra, dù cuối cùng không có mức phạt tối đa thì chỉ riêng chi phí điều tra, chấn chỉnh cũng đủ cho công ty uống một nồi.

Từ meme đến huyền thoại

Nguồn gốc của vấn đề này thực sự rất đơn giản. Một người dùng nền tảng X đã đăng một dòng tweet: "Những đồng nghiệp đã tốt nghiệp vẫn chưa biến mất, họ chỉ được chắt lọc thành token và thay thế bằng một hình thức khác để đồng hành cùng bạn!" Đây là một trò đùa rằng sau khi bước vào kỷ nguyên đại lý, tất cả các công ty đều đánh giá giá trị của mô hình dựa trên mức tiêu thụ mã thông báo.

Dòng tweet đã gây được tiếng vang trong các vòng tròn nhỏ. Vì nó chạm đến điểm yếu chung nên mọi người đều lo lắng về việc bị thay thế bởi AI.

Vậy là chúng ta có được kỹ năng của những đồng nghiệp "tinh luyện" hiện tại. Sau khi dự án

được phát hành trên GitHub, mọi người đều biết đó là một món đồ chơi.

Nhưng mọi thứ nhanh chóng trở nên tồi tệ. Khi các dự án phụ như Boss.Skill và Predecessor.Skill xuất hiện, chủ đề bắt đầu thay đổi từ thí nghiệm kỹ thuật sang nuôi dưỡng cảm xúc.

Những người không hiểu về công nghệ sẽ nghĩ rằng bạn thực sự có thể "hồi sinh" một người thành AI khi họ nhìn thấy những meme này. Từ những câu chuyện cười đến những hiểu lầm, chỉ có một chuỗi giao tiếp.

Khi vấn đề này lọt vào tầm dư luận, câu chuyện bắt đầu đi chệch khỏi sự thật.

Công nghệ được phóng đại gấp 100 lần và tác động xã hội được khuếch đại gấp 1000 lần.

Một công cụ ghép văn bản đơn giản được đóng gói dưới dạng "sự bất tử kỹ thuật số". Một dự án đồ chơi trên GitHub đã trở thành một "cuộc khủng hoảng hiện sinh tại nơi làm việc". Một lời nhắc rất bình thường được hiểu là "sự khởi đầu của AI thay thế con người".

Như tôi đã nói lúc đầu, sự lo lắng dễ lây lan hơn sự thật.

Điều công chúng cần không phải là báo cáo kỹ thuật chính xác mà là những câu chuyện có thể khơi dậy sự cộng hưởng cảm xúc.

Trong quá trình này, từ việc bị coi là trò đùa trong cộng đồng kỹ thuật đến được công chúng tôn sùng, công nghệ đã bị bóp méo trong quá trình giao tiếp.

Một dự án lan truyền từ cộng đồng nhà phát triển đến dư luận. Mỗi khi nó đi qua một liên kết, các chi tiết kỹ thuật sẽ được đơn giản hóa và câu chuyện được phóng đại.

Cuối cùng, trình thu thập dữ liệu python ban đầu đã trở thành "sự bất tử kỹ thuật số".

Khi hầu hết mọi người không có kiến thức cơ bản về AI, họ rất dễ bị câu chuyện này đánh lừa. Họ không biết sự khác biệt giữa kỹ thuật từ gợi ý và đào tạo mô hình, họ không biết sự khác biệt giữa việc đưa ngữ cảnh vào và trí nhớ thực, và họ không biết sự khác biệt giữa việc nhập vai và tái tạo nhân cách.

Khoảng cách nhận thức này nhường chỗ cho sự tồn tại của câu chuyện cường điệu.

Tôi nghĩ điều thực sự đáng lo ngại không phải là bản thân dự án của đồng nghiệp.Kỹ năng hay ông chủ.Kỹ năng, mà là sự hiểu lầm có hệ thống của công chúng về công nghệ.

Việc phóng đại khả năng kỹ thuật vì mục đích giao thông sẽ khiến công chúng hiểu sai về AI.

Khi chúng ta tập trung vào mánh lới quảng cáo “đồng nghiệp được trau chuốt”, những vấn đề thực sự quan trọng sẽ bị bỏ qua.

Làm cách nào để bảo vệ quyền dữ liệu cá nhân trong kỷ nguyên AI?