KPI Tình Yêu
Chương 46: Công Ty Bị Tố Đạo Data
Chương 46

Công Ty Bị Tố Đạo Data

3 giờ 12 sáng. Phòng CEO. Tầng 20.

Tôi ngồi đây 6 tiếng rồi. Kể từ lúc CEO gọi, kể từ lúc môi tôi cách môi An Hạ 5 giây, tôi ngồi đây, trong phòng này, nhìn tờ đơn kiện 47 trang trên màn hình.

SynAI Technologies Pte. Ltd. v. HyperMind AI Corp. Cáo buộc: vi phạm bản quyền dữ liệu huấn luyện. Bằng chứng: pattern matching output 87.3% tương đồng giữa AI model HyperMind và proprietary dataset SynAI.

87.3%. Cao. Cao đến mức hoặc là trùng hợp thống kê (xác suất <0.01%) — hoặc ai đó thực sự đã đổ data SynAI vào pipeline của chúng tôi.

Tôi đọc 47 trang. Hai lần. Gạch chân. Không tìm thấy lỗ hổng logic nào trong cáo buộc của họ. Và đó, đó mới là thứ khiến tôi không ngủ được.

CEO đứng bên cửa sổ. Áo polo đen, cùng cái từ chiều. Ly cà phê thứ 4 trên bàn. Ông ấy nói chuy��n với ai đó trên điện thoại, giọng thấp, nhanh. Legal team, có lẽ.

Gia Hân ngồi đối diện tôi. Laptop mở, 3 tab: email investor, draft PR statement, WhatsApp nhóm fund managers. Cô ấy không hỏi tôi chuyện gì, cô ấy không cần hỏi. Mắt Gia Hân nhìn tôi lúc 9 giờ 30 khi tôi bước vào phòng CEO, mắt "anh ổn không" mà không có âm thanh.

Tôi không ổn. Nhưng đó không phải vấn đề bây giờ.

– Minh.

CEO đặt điện thoại. Quay lại. Mặt, tôi chưa thấy ông ấy như này. Phó Thành Dương, người nói "trust the process" mỗi meeting, người cười khi công ty suýt cháy, đêm nay không cười.

– Nói cho anh nghe, anh ta nói, giọng thấp, model AI của chúng ta, training pipeline, em có chắc 100% data source hợp pháp không?

Câu hỏi. Câu hỏi mà nếu đáp án là "có," tôi đã trả lời ngay. Nhưng—

– Tôi build model. Nhưng training data pipeline, team Data Engineering quản lý. Tôi define yêu cầu, họ source data. Tôi kiểm tra quality, không kiểm tra nguồn gốc từng dataset.

– Vậy em không chắc.

– Tôi chắc rằng khi tôi restructure pipeline 4 tháng trước, mọi thứ clean. Nhưng trước đó, trước tháng 1, tôi không kiểm soát.

Trước tháng 1. Trước Operation Ascend. Trước khi CEO restructure team theo hướng mới. 6 tháng, khoảng thời gian mà ai đó có thể đã inject external data vào pipeline mà không ai biết.

CEO im. 5 giây. Rồi:

– Giữ chuyện này nội bộ. Chưa ai được biết ngoài phòng này.

– Anh Dương. – Tôi đứng dậy. – Nếu chúng ta có lỗi thật, che đậy sẽ tệ hơn. Tôi cần audit toàn bộ pipeline từ ngày đầu.

– Em cần hiểu tình thế. – CEO bước lại gần. Giọng, kiểu giọng tôi chưa nghe: không phải sếp nói với nhân viên. Kiểu anh lớn nói với em. – Series C. 50 triệu đô. Vertex Ventures đã confirm tuần trước. Nếu scandal này ra ngoài TRƯỚC KHI chúng ta có câu trả lời, funding sẽ chết. Công ty sẽ chết. 200 người mất việc.

200 người. Con số. Quen thuộc, kiểu con số trong presentation. Nhưng đêm nay nó nặng khác. 200 người có lương, có gia đình, có OT thứ Sáu rồi uống bia Popeyes ở pantry.

– Tôi hiểu. – Tôi nói. – Nhưng—

– GIỮ NỘI BỘ. – CEO nhìn th���ng. Mắt, lần đầu tôi thấy Phó Thành Dương ra lệnh thay vì gợi ý. – Cho anh 72 giờ. Em audit pipeline. Gia Hân manage investor. Anh handle legal. 72 giờ.

Gia Hân gật. Không hỏi. Cô ấy biết khi nào nên im, kiểu investor relation, đọc phòng trước khi đọc số.

Tôi nhìn CEO. 3 giờ 18 sáng. Mệt. Mắt ông ấy, có thứ gì đó. Không phải sợ. Không phải tức. Thứ gì đó giống, biết trước.

Ông ấy không surprised. Đêm nay khi tôi bước vào, ông ấy đã có đơn kiện trên bàn, đã gọi legal, đã draft timeline response. Nhanh quá. Phản ứng nhanh quá cho người vừa nhận tin.

Ông ấy biết. Ông ấy biết từ trước.

Hay tôi paranoid vì 3 giờ sáng?

– 72 giờ. – Tôi nói. – Được.

Gia Hân đứng dậy. Thu laptop. Nhìn tôi, 1 giây. Mắt cô ấy nói: "Cẩn thận." Rồi đi.

CEO đi theo. Dừng ở cửa.

– Minh. – Ông ấy nói, lưng quay. – Nếu em tìm ra thứ gì đó... uncomfortable. Nói anh trước. Chỉ anh.

"Uncomfortable." Từ đó. Không phải "sai." Không phải "phạm pháp." "Uncomfortable." — kiểu dùng từ của người biết đáp án nhưng muốn kiểm soát ai biết trước.

– Anh Dương. – Tôi nói. – Anh có biết gì mà anh chưa nói không?

Hỏi thẳng. Kiểu tôi. Kiểu 3 giờ sáng không có thời gian cho ngoại giao.

CEO quay lại. Nhìn tôi. 3 giây.

– Không. – Ông ấy nói. – Nhưng anh có linh cảm. Và linh cảm đó, anh không thích.

Đi. Cửa đóng.

"Linh cảm." Phó Thành Dương, CEO dùng data cho mọi quyết định, người nói "anh không tin feeling, anh tin number" — đêm nay nói "linh cảm."

Ông ấy biết. Tôi chắc 80%. Nhưng 80% không đủ. Cần data.

· · ·

4 giờ sáng. Phòng tôi. Tầng 20.

Rót nước. Ly thứ 3, đen đá từ máy pha tầng 20. Đắng. Lạnh. Kiểu cà phê 4 giờ sáng, không uống vì ngon, uống vì cần.

Bình thường, 4 giờ sáng, tôi ở The Marq, playlist nhạc không lời, debug feature mới vì thích. Kiểu "ở lại khuya vì muốn." Đêm nay, ở lại vì phải. Và sự khác biệt đó nặng hơn tôi tưởng.

Mở laptop. Login vào data warehouse nội bộ. Bật terminal, fingers trên bàn phím quen thuộc, nhưng đêm nay mỗi dòng lệnh nặng hơn bình thường.

Pipeline overview: 47 datasets. 23 nguồn công khai (Common Crawl, Wikipedia, academic papers, clean). 14 nguồn licensed (Reuters, Bloomberg, VnExpress API, có hợp đồng). 10 nguồn internal (user interaction logs, chatbot transcripts, grey area nhưng legal nếu anonymize đúng).

47 datasets. Tôi kiểm tra 47 cái từ tháng 1. Mọi thứ ổn.

Nhưng trước tháng 1?

Mở git log cho data pipeline. Scroll back 6 tháng, tháng 7/2025. Commits. Pull requests. Merge history.

Tháng 7. Tháng 8. Tháng 9. Bình thường. Bình thường. Bình—

Tháng 10.

Commit hash: `a3f7b2c`. Author: `ops_service_account`. Message: "Add supplementary training data batch, Q3 enrichment."

ops_service_account. Tài khoản chung. Không phải tên cá nhân. Ai đó dùng service account để push data, kiểu muốn ẩn danh.

Batch size: 12GB. Lớn. Rất lớn cho "supplementary." Dataset bình thường 500MB-2GB.

Và tôi ��� Head of AI Product, không biết về commit này. Vì tháng 10, tôi đang focus vào SaigonBank pilot prep, không review pipeline commits.

Mở file manifest cho batch đó. Metadata sparse, không có source URL, không có license field, chỉ có description: "SEA conversational data enrichment, Q3 priority."

"SEA conversational data enrichment." Mô tả vô nghĩa. Kiểu mô tả của người muốn trộn thứ gì đó vào mà không ai hỏi.

Ai có access vào ops_service_account tháng 10?

Mở IAM logs. Kiểm tra permissions. 3 người có access: CTO (đã ngh��� tháng 11), Data Engineering lead (Minh Quang), và—

Và admin override, bất kỳ Director trở lên.

Director. Kiến Phong là Director. Kiến Phong có admin override.

Nhưng Kiến Phong không biết push code. Anh ta không phân biệt nổi Python và PowerPoint. Tháng 10 anh ta đang đâu? Đang close deal. Đang chơi golf. Đang gọi NovaTech.

NovaTech. Singapore. SynAI cũng Singapore.

Trùng hợp?

Hay, ai đó khác dùng admin override? CEO cũng có admin access. CTO cũ có. Và CTO cũ, người nghỉ tháng 11, đúng 1 tháng sau commit đáng ngờ, giờ đang ở đâu?

Mở LinkedIn. CTO cũ, Nguyễn Đức Huy. Vị trí mới: VP Engineering, SynAI Technologies, Singapore.

SynAI. CTO cũ của HyperMind giờ ở SynAI. Người kiện HyperMind.

Người có access toàn bộ pipeline trước khi nghỉ.

Tháng 10: inject data. Tháng 11: nghỉ việc. Tháng 5: kiện từ công ty mới.

Inside job. Không phải Kiến Phong. Đức Huy. CTO cũ.

Nhưng, tại sao? Trả thù? Hay, ai đó sai Đức Huy làm? Ai đó muốn HyperMind chết trước Series C?

Quá nhiều câu hỏi cho 4 giờ sáng. Nhưng có một thứ tôi biết chắc: cáo buộc 87.3% pattern matching, có lẽ không sai. Data ĐÃ bị inject. Câu hỏi không phải "có hay không" mà là "ai" và "tại sao."

Và câu hỏi thứ ba, câu mà tôi không muốn hỏi nhưng não tự hỏi: CEO biết không? Ông ấy, người restructure team, người tạo Operation Ascend, người nói "trust the process" — có phải ông ấy cũng là một biến trong phương trình này?

Đừng nghĩ v���y. Phó Thành Dương là người mang tôi vào từ ngày đầu. 12 người. Quán cà phê Pasteur. "Minh, tao muốn build thứ gì đó lớn. Mày có dám không?" Tôi dám. Vì tin ông.

Nhưng "tin" — An Hạ dạy tôi, khác "biết."

5 giờ sáng. Mắt cay. Cà phê nguội trên bàn, ly thứ 2. Màn hình sáng, terminal chạy query, git blame đang load.

Tôi không tìm được người. Chưa. Nhưng tôi tìm được thời điểm: tháng 10. 12GB data inject qua service account. Không document. Không review.

Và nếu 12GB đó là data của SynAI, thì cáo buộc của họ đúng. HyperMind DID dùng data bất hợp pháp. Không phải vì tôi, nhưng model tôi build đã train trên data đó.

Model tôi build. Sản phẩm tôi tự hào. AI Copilot 96.1% accuracy. SaigonBank pilot phase 2. Standing ovation Marina Bay Sands.

Tất cả, có thể, đứng trên nền móng ăn cắp.

Đóng laptop. Đứng dậy. Đi ra cửa sổ. Sài Gòn 5 giờ sáng, trời bắt đầu hửng, xe rác chạy dưới đường, mấy quán phở đầu hẻm bắt đầu bốc khói.

5 giờ sáng. 8 tiếng trước, tôi ��ứng trên rooftop này, tay nâng cằm An Hạ, 5 giây nữa là hôn.

Bây giờ tôi đứng 2 tầng dưới, một mình, mắt cay, biết rằng công ty tôi có thể đã phạm luật mà tôi không hề hay.

Điện thoại rung. Màn hình:

An Hạ (3 cuộc gọi nhỡ, 9:20 PM, 10:05 PM, 11:30 PM).

An Hạ (Slack, 11:47 PM): "Vừa thấy bài VnExpress. CEO gọi anh urgent vì đây đúng không?"

An Hạ (Slack, 12:15 AM): "Kha Minh?"

An Hạ (Slack, 1:30 AM): "Anh ổn không?"

3 cuộc gọi. 3 tin nhắn. Cô thức đến 1 giờ 30, chờ tôi.

Và tôi, đang ngồi cùng tầng, cùng tòa nhà, cách cô 1 cái Slack reply, im.

Vì CEO nói "giữ nội bộ." Vì tôi chưa biết sự thật. Vì nếu tôi nói "tôi không chắc HyperMind có lỗi hay không" — tôi sẽ khiến cô lo. Và cô, cô vừa mới nói "sợ không thử hơn." Cô vừa mới mở cho tôi. Tôi không muốn thứ đầu tiên cô nhận sau đó là "tôi không biết công ty có phạm pháp không."

Nhưng im, im cũng là chọn. Im là nói dối bằng cách không nói.

Gõ:

"Không có gì nghiêm trọng. Chuyện nội bộ. Ngủ đi."

Gửi.

Lời nói dối. Lời nói dối đầu tiên với An Hạ. 5 tháng, không một lần. Đêm nay, lần đầu.

Và tôi biết: sẽ không phải lần cuối.

Vì scandal mới bắt đầu. Vì 72 giờ không đủ. Vì 12GB data không tự biến mất. Vì ai đó trong công ty này, ai đó tôi có thể biết mặt biết tên, đã phá.

Và tôi, người vừa bước vào mối quan hệ mới nhất đời, sẽ phải chọn giữa bảo vệ cô và bảo vệ công ty.

Ba nói: "Cảm xúc dẫn thì thành ngu."

Lần đầu tiên trong rất lâu, tôi sợ ông đúng.

Nằm xuống sofa phòng CEO. Không về The Marq. Nhắm mắt. 5 giờ 15 sáng. Họp legal 7 giờ.

Ngủ. 1 tiếng 45 phút. Đủ.

Nhưng trước khi ngủ, hình ảnh cuối cùng không phải đơn kiện 47 trang, không phải git log, không phải mặt CEO.

Mắt An Hạ. Trên rooftop. Lúc cô nói "sợ không thử hơn."

Cô dũng cảm hơn tôi. Cô nói thật, dù sợ. Và tôi, người đáp "bao lâu cũng đư���c," người nâng cằm cô, người suýt hôn, đáp lại bằng lời nói d��i đầu tiên.

"Không có gì nghiêm trọng."

Có. Rất nghiêm trọng. Nghiêm trọng hơn bất kỳ thứ gì kể từ ngày tôi vào công ty.

Nhưng tôi chọn im. Vì CEO bảo im. Vì chưa có đáp án. Vì tôi, kiểu đàn ông mà Gia Hân gọi l�� "incomplete," ki��u con trai mà ba gọi là "logic trên hết" — không biết cách nói "anh sợ" khi vừa mới, VỪA MỚI, bắt đầu cho phép mình sợ.

Gia Hân đúng. Tôi chọn công ty. Lại.

Nhưng lần này, lần này khác. Lần này tôi chọn công ty vì nếu công ty chết, An Hạ cũng m���t. 200 người mất. Thứ cô và tôi vừa build, KPI, pilot, reputation, mất hết.

Tôi chọn công ty VÀ cô. Không phải THAY VÌ cô.

Đúng không?

...

Xin lỗi, An Hạ. Cho tôi 72 giờ.

Rồi tôi sẽ nói thật. Tất cả.

Nhắm mắt. Sofa cứng. Điều hòa lạnh.

Ngoài cửa sổ, Sài Gòn 5 giờ 20 sáng bắt đầu thức, không biết rằng bão đang đến.

Ch.46/55
2.237 từ