AI Model Mới
Thứ Hai, tuần 33. 6 giờ sáng. Product Lab, tầng 19, phòng nhỏ cuối hành lang.
Phòng này trước là kho. Nghiêm túc, kho. Từng chứa 3 thùng giấy A4, 2 cây cột banner cũ, và 1 máy in Canon mà ai cũng nghĩ đã chết nhưng thực ra chỉ kẹt giấy.
Bây giờ: 2 bàn kê sát nhau, 4 màn hình, 1 bảng trắng kín chữ, dây cáp nối từ tường ra 3 cái hub USB. Kiểu, kiểu garage startup trong phim Silicon Valley, trừ việc không có garage, không ở Valley, và người ngồi trong đây vừa bị demote từ Head xuống IC.
Terminal. `phoenix/core-v0.2`. Commit #67.
git commit -m "attention mechanism v2: context-aware tonal embedding for compound Vietnamese words"
67 commit. 3 tuần. Trung bình 3.2 commit/ngày. Nhưng, nếu tính theo giờ, mỗi commit trung bình 4 tiếng. 4 tiếng code, debug, test, reject, code lại.
V1.0, AI cũ, build trong 18 tháng. 12 engineer. $2M budget.
V2.0, Phoenix, phải xong trong 3 tuần. 7 engineer. Budget = 0.
Kiểu bài toán mà giáo sư Bách Khoa sẽ ghi "vô nghiệm" bên lề. Nhưng, ba tôi không phải giáo sư kiểu đó. Ba tôi là giáo sư kiểu "con giải đi, ba chờ."
Thì giải.
Minh Tú đến. 6h15. Ly cà phê đen, ống hút giấy, kiểu gen Z uống cà phê: đen nhưng phải có ống hút.
– Anh. Tối qua em refactor xong layer 3. Attention weight cho thanh điệu, sạch. Không leak từ V1 data nào.
– Benchmark?
– Accuracy tổng: 89.2%. Phương ngữ Nam: 91.1%. Bắc: 87.8%. Trung: 82.4%.
82.4% Trung. Thấp. Nhưng, V1 lúc launch cũng chỉ 78%. Và V1 train trên 500 nghìn cuộc gọi, V2 train trên 180 nghìn, tất cả open-source hoặc licensed. 0 dòng data HyperMind cũ.
0. Dòng. Mỗi byte trong V2 đều có giấy phép. Kiểu clean mà, kiểu nếu PwC quay lại audit, tôi mở pipeline cho họ xem từ dòng 1. Không giấu. Không tắt đường.
Bài học đắt giá nhất 6 tháng: transparency không phải feature. Là foundation.
– Trung 82.4%. Nhìn Minh Tú. Vấn đề ở đâu?
– Thanh hỏi-ngã. – Cô ấy mở laptop, kéo confusion matrix. – "Ơi" với "ởi" — model vẫn lẫn. Và "đã" trong "đã ăn" vs "đã" kiểu Huế = 2 nghĩa hoàn toàn khác.
Tiếng Việt. 6 thanh điệu. 3 phương ngữ. Ngữ pháp phụ thuộc ngữ cảnh. Kiểu ngôn ngữ mà, nếu tiếng Anh là bài toán đại số, tiếng Việt là giải tích phi tuyến.
Nhưng, đó là lý do tôi về Việt Nam. Không phải vì Google DeepMind trả ít. $180K/năm, đủ mua căn hộ Cầu Giấy sau 3 năm. Về vì, vì AI tiếng Việt chưa ai làm đúng. Chưa ai xây từ gốc. Và, nếu không phải tôi, thì ai?
Kiểu câu hỏi mà ba sẽ bảo "tự cao." Nhưng, không phải tự cao nếu nó là sự thật.
– Contextual embedding. Gõ lên bảng trắng, marker đỏ. Từ "đã" cần context 3 từ trước + 2 từ sau để disambiguate. Hiện tại model nhìn window 2. Tăng lên 5.
Minh Tú gật. Chậm. Kiểu gật mà, kiểu gật "em hiểu, nhưng—"
– Window 5 = gấp đôi compute. Latency tăng.
– Bao nhiêu?
– Estimate: 0.3 giây.
0.3 giây. V2 hiện tại latency 0.5 giây. Thêm 0.3 = 0.8 giây. V1 lúc launch = 0.8 giây. Tức, quay về điểm xuất phát.
Nhưng, accuracy 82.4% → ước tính 90%+ nếu fix thanh hỏi-ngã. Trade-off: nhanh nhưng sai, hay chậm hơn nhưng đúng?
– Chấp nhận. 0.8 giây. Accuracy quan trọng hơn speed ở giai đoạn này. Quay lại terminal. Demo tuần sau. Nếu model nói sai "đã" trước mặt CEO, mất tất cả.
Minh Tú cười. Nhẹ. Kiểu cười mà, kiểu "anh lúc nào cũng extreme." Nhưng cô ấy mở laptop. Bắt đầu code. Không hỏi thêm.
Đó là lý do Minh Tú ở lại. Không phải vì speech "build something that matters." Vì, cô ấy thích bài toán khó. Và Phoenix, đầy.
3 tuần. Montage.
Không phải montage phim, kiểu nhạc pump up, cảnh code xẹt qua, rồi bùm, xong. Montage thật: 3 tuần mệt. 3 tuần mà, mỗi ngày dài hơn ngày trước.
Tuần 1: Architecture. Xóa sạch neural network cũ. Viết lại từ layer 1. Minh Tú xây data pipeline mới, 180 nghìn cuộc gọi, giấy phép rõ ràng, thông tin ghi nguồn từng tập tin. Lý Thành Đạt (junior 2 năm) chạy test suite, 4.000 test case, mỗi ngày thêm 200.
Mỗi đêm: commit, push, test fail, debug, fix, test pass, commit, push. Lặp. Kiểu, kiểu vòng lặp while(true) mà điều kiện dừng = "model hoạt động."
Tuần 2: Training. GPU server thuê từ AWS — $47/giờ. Cash runway không cho phép chạy 24/7. Nên chạy đêm, giá rẻ hơn 40%.
Tôi ngồi office 11 giờ đêm, nhìn training loss giảm dần trên bảng theo dõi: 0.85... 0.71... 0.63... Kiểu nhìn nước chảy, nếu nước là số, và sông là gradient descent.
Nguyễn Phương, data engineer, ở lại mỗi đêm. Lý do: "Em ở vì ghét Đức Huy." Lý do kỳ lạ nhất trong team. Nhưng, motivation là motivation. Không phân biệt nguồn gốc.
Trần Quang Vinh — "em ở vì đang giữa sprint, bỏ mid-sprint thì kỳ." Sprint này đã kéo 3 tuần. Anh ta vẫn ở. Sprint chưa hết vì, vì tôi không cho hết. Không phải vì cruel. Vì, cần.
Tuần 3: Optimization. Model chạy. Accuracy tổng: 91.7%. Phương ngữ Nam: 94.2%. Bắc: 90.8%. Trung: 88.1%.
88.1% Trung. Từ 82.4%. Context window 5 hoạt động. "Đã" không lẫn nữa. "Ơi" vs "ởi" — giảm 87% false positive.
Latency: 0.72 giây. Tốt hơn estimate 0.8. Lý do: Minh Tú optimize matrix multiplication bằng trick từ paper mới trên arXiv, cô ấy đọc lúc 1 giờ sáng thứ Tư, implement lúc 3 giờ. Gửi Slack: "anh xem cái này" kèm benchmark. Tôi đọc, gật — "merge đi."
$150K SynAI. Minh Tú từ chối. Vì trick arXiv lúc 1 giờ sáng.
Kiểu người mà, tiền không thuê được. Chỉ bài toán hay mới giữ được.
Benchmark cuối cùng. Thứ Năm, tuần 35.
Bảng trắng, kín số. Tôi đứng, marker đỏ, viết:
> Phoenix V2 vs HyperMind V1 > | Metric | V1 | V2 | Delta | > |--------|-----|-----|-------| > | Accuracy tổng | 87.3% | 91.7% | +4.4% | > | Phương ngữ Nam | 89.1% | 94.2% | +5.1% | > | Latency | 0.8s | 0.72s | -10% | > | Data size | 12GB (tainted) | 4.2GB (clean) | -65% | > | Training cost | $48K | $6.2K | -87% | > | Audit trail | Không | 100% | ∞ |
Nhìn. Nhìn lại.
V2 tốt hơn V1. Mọi metric. Với 1/3 data, 1/8 chi phí, 1/3 thời gian. Và, sạch. Mỗi byte có nguồn gốc. Mỗi dòng code có commit message.
Build something BETTER from ashes.
Kiểu, kiểu câu trong TED talk mà tôi ghét. Nhưng, đúng. Lần này đúng.
7 người đứng sau lưng tôi nhìn bảng. Im. 5 giây.
Minh Tú, vỗ vai tôi. Nhẹ. Kiểu vỗ mà, Minh Tú hiếm khi chạm ai. Cô ấy hướng nội hơn tôi. Và tôi đã rất hướng nội.
– Anh. Mình làm được rồi.
"Mình." Không phải "team." Không phải "anh." "Mình." Kiểu, kiểu từ mà Minh Tú dùng khi nói thật.
– Chưa. Quay lại. Demo mai. Nếu CEO gật, mới xong.
Nhưng, biết. Biết rồi. V2 hoạt động. 3 tuần. 7 người. Từ 0.
Thứ Sáu, tuần 35. 10 giờ sáng. Phòng họp Athena. Demo day nội bộ.
Athena, phòng họp lớn nhất. Tầng 19. Kính trong, nhìn ra open space. Kiểu phòng mà 6 tháng trước chứa 30 người. Hôm nay, 15.
15 người. Toàn bộ HyperMind còn lại. Ngồi. Đứng. Dựa tường. Ai cũng có cà phê, Highland đen đá hoặc trà đào. Kiểu họp mà, không bắt buộc nhưng ai cũng đến.
CEO, hàng đầu. Ghế xoay, bút Mont Blanc trên tay. Mặt, bình. Kiểu bình mà tôi từng đọc rất giỏi. Bây giờ, không cần đọc nữa.
Vì, vì tôi không demo cho CEO. Demo cho 15 người. Cho team. Cho, mình.
Gia Hân, góc phòng. Laptop mở, ghi chép. IR mode. Cô ấy sẽ đưa kết quả demo vào data room cho Tiger Global.
Vy Vy, đứng cạnh cửa. Phone quay video. Tất nhiên.
Và, An Hạ. Hàng 2. Sổ tay mở. Bút trong tay. Ghi chép.
Ghi chép. Kiểu, kiểu An Hạ luôn ghi chép. Kiểu cô nhìn mọi thứ qua lăng kính "có dùng được cho growth pitch không." Và, tôi thích điều đó. Thích vì, cô không đến để cổ vũ. Đến để dùng. Practical. Real.
Đứng. Laptop kết nối projector. Màn hình, terminal.
– Phoenix V2. Nói. Không slide. Không PowerPoint. Chỉ terminal + bảng trắng. 3 tuần. 7 người. 0 dòng data cũ.
Gõ. Live demo. Input: cuộc gọi mẫu, khách hàng SaigonBank, giọng miền Trung:
"Cho tui hỏi, cái khoản vay đã duyệt chưa, tui gọi mấy bận rồi mà chưa ai trả lời."
Phoenix V2, xử lý. 0.71 giây.
Output trên màn hình:
> Nhận diện: Phương ngữ Trung (Huế) — confidence 96.2% > "đã duyệt": Past tense marker, không phải Huế colloquial → giữ nghĩa "approved" > "mấy bận": = "nhiều lần" — regional variant > Đề xuất phản hồi: "Dạ, em kiểm tra ngay cho anh/chị. Khoản vay số [X] đang ở bước [Y]. Anh/chị chờ em 30 giây nha."
Im. Phòng, im. 15 người nhìn màn hình.
Gõ tiếp. Input 2: giọng miền Nam, ngữ cảnh phức tạp:
"Ê, cái app không cho đăng nhập, tui bấm hoài mà nó cứ xoay xoay, bực ghê."
V2: 0.68 giây.
> Nhận diện: Phương ngữ Nam (Sài Gòn) — confidence 98.1% > "bấm hoài": = "bấm liên tục" — informal > "xoay xoay": Loading indicator, technical context > "bực ghê": Sentiment: frustrated (high) > Đề xuất: Xin lỗi + hướng dẫn clear cache + escalate nếu tiếp tục lỗi
Lý Thành Đạt, junior 2 năm, ngồi cuối, vỗ tay. Nhỏ. Rồi Nguyễn Phương. Rồi Quang Vinh. Rồi, cả phòng.
15 người. Vỗ tay.
Kiểu vỗ tay mà, không phải kiểu pitch. Không phải vỗ vì lịch sự. Vỗ vì, vì họ thấy. AI mới. Tốt hơn. Sạch hơn. Và, của họ. Không phải của SynAI. Không phải bản sao. Nguyên bản.
CEO, đứng. Bút Mont Blanc bỏ vào túi. Nhìn tôi. Mắt, kiểu mắt mà, kiểu mắt 6 năm trước, quán cà phê Pasteur, khi tôi demo prototype đầu tiên trên laptop Dell cũ:
– Đây. Giọng nhẹ. Đây là tại sao tôi bắt đầu HyperMind.
"Tại sao." Không phải "tốt lắm." Không phải "giỏi." "Tại sao" — kiểu CEO nói khi thấy lại lý do mình tồn tại.
Và, 6 tháng trước, câu đó sẽ khiến tôi đứng thẳng hơn. Sẽ, validate. Sẽ — "CEO công nhận, tức tôi đúng."
Bây giờ, nghe. Gật. Và, không cần.
Không phải vì ghét. Vì, vì tôi không code 3 tuần cho CEO. Không code cho board. Không code cho Tiger Global.
Code vì, vì đây là thứ đúng cần làm. V1 sai. V2 đúng. Kết. Không cần ai gật.
Kiểu, kiểu ba sẽ không hiểu. Ba sẽ hỏi "được tăng lương chưa?" Nhưng, kiểu trưởng thành mà tôi đang trải qua, không đo bằng lương.
Sau demo. Pantry tầng 19. Người tản dần. Ai đó mua trà đào, 15 ly. Kiểu ăn mừng HyperMind: trà đào. Không champagne. Không beer. Trà đào. Vì, vì 15 người, 10 người uống trà đào.
Đứng một mình. Rửa ly.
Bước chân. Phía sau. Nhẹ. Nhưng, nhận ra. Mùi chanh và cỏ vetiver, nhẹ, thoảng, kiểu mùi mà tôi đã thuộc lòng nhưng vẫn—
– Anh build lại cả model trong 3 tuần?
Quay. An Hạ. Sổ tay vẫn trong tay. Bút kẹp giữa ngón, kiểu cô luôn cầm bút như vũ khí.
– 3 tuần 2 ngày. Chính xác.
– Với 7 người.
– 7 người giỏi.
Im. 2 giây. Cô, nhìn. Kiểu nhìn mà, kiểu nhìn An Hạ khi phân tích data: chăm chú, tìm anomaly, tìm thứ không khớp.
– Gì đã motivate anh? – Hỏi. Thẳng. Kiểu An Hạ: không vòng.
Câu hỏi. Real.
Đáp án real: nhiều thứ. Phoenix cho công ty sống. Phoenix chứng minh tôi không phải kẻ để data leak. Phoenix là bài toán hay nhất 5 năm. Tất cả, đúng.
Nhưng, có thêm 1 thứ. Thứ mà, nếu nói, sẽ vi phạm "đi riêng."
– Motivation giúp.
– Motivation gì?
Nhìn cô. Mắt, sáng. Kiểu sáng mà cô có khi hỏi thứ gì đó cô đã biết đáp án, nhưng muốn nghe.
Nói.
– Muốn chứng minh cho... ai đó.
"Ai đó." Không nói tên. Nhưng, nhìn cô. Và cô, biết. Tất nhiên biết. Lâm An Hạ đọc data tốt hơn bất kỳ ai tôi từng gặp. Và, biểu cảm tôi lúc này = data.
Cô, môi hơi cong. 1mm. Kiểu gần cười, nhưng giữ lại. Kiểu An Hạ cười khi không muốn ai thấy.
– "Ai đó" nên biết ơn. – Xoay người. Đi. – Model tốt lắm. Tôi sẽ dùng số liệu cho pitch.
"Tốt lắm." Từ An Hạ. Kiểu, kiểu cô khen data, không phải khen người. Nhưng, tôi nghe "tốt lắm" từ cô khác với "tốt lắm" từ CEO. Khác, nhiều.
Nhìn cô đi. Tóc buộc đuôi ngựa, bút kẹp tai, bước nhanh. Sổ tay đã đóng, ghi chép xong. Cô, đã lấy được thứ cô cần. Growth strategist. Thực dụng.
Nhưng — "ai đó nên biết ơn." Câu đó. Không thực dụng. Câu đó, riêng tư.
Và cô nói.
11 giờ đêm. The Marq, tầng 15.
Laptop mở. Notion. Journal, private, không share ai.
Viết:
"Project Phoenix complete. V2 ready. 91.7% accuracy, 0.72s latency, 100% clean data. 3 tuần 2 ngày. 7 người.
Nhưng, rebuild thật không phải AI.
Là tôi.
6 tháng trước, tôi code vì control. Vì không ai làm đúng bằng tôi. Vì, nếu tôi kiểm soát pipeline, không ai sai.
Nhưng pipeline vẫn bị breach. Control, ảo tưởng.
3 tuần qua, code khác. Code với Minh Tú, và tin cô ấy merge mà không review từng dòng. Code với Thành Đạt, và để junior viết test case mà không sửa. Code với Phương và Vinh, và khen khi họ tìm bug tôi bỏ sót.
Kiểu lead mà, kiểu lead không cần kiểm soát. Cần, trust.
Trust.
Cô ấy dạy tôi từ đó. Không trực tiếp. Không bằng lời. Bằng, bằng cách cô ấy nhìn tôi mà thấy Quang. Bằng, bằng câu hỏi 'đến bao giờ' mà tôi tự hỏi chính mình.
Đến bao giờ tôi ngừng kiểm soát mọi thứ?
Đến, đây. 3 tuần qua. Phoenix. Lần đầu, tôi build thứ gì đó mà không cần kiểm soát mọi byte.
Và, tốt hơn.
Cô ấy nói: 'Ai đó nên biết ơn.'
Ai đó biết ơn. Nhiều hơn cô nghĩ."
Đóng Notion. Nhìn ra cửa sổ, Sài Gòn, đêm, đèn đường Hàm Nghi nhấp nháy. Xe Grab xanh chạy ngang, 11 giờ đêm mà vẫn kẹt.
60 ngày Tiger Global. Đã qua 35. Còn 25.
V2 ready. Campaign AH đang chạy. 5 khách re-engage. Pitch deck, cần hoàn thành.
Và, recording Đức Huy. 47 phút. Chưa dùng. Chờ đúng lúc.
Phone. Mở. Zalo. Cuộn lên, 3 ngày trước. Tin nhắn cuối: cô gửi emoji 👍 khi tôi share benchmark V2.
Thumbs up. Gọn. Professional.
Nhưng, cô mở ngay. 11 giờ đêm. Mở ngay.
Kiểu, kiểu "đi riêng" mà vẫn check notification.
Không nhắn. Không cần. Để, demo nói thay.
Đặt phone xuống. Nằm. Nhìn trần.
"Muốn chứng minh cho ai đó."
Sự thật. Nhưng, không phải toàn bộ sự thật.
Toàn bộ sự thật: muốn trở thành người xứng đáng để cô nhìn, mà không thấy bóng ma.
Chưa. Nhưng, đang.
Phoenix. Nghĩa đen: con phượng hoàng hồi sinh từ tro.
Kiểu tên mà, nếu ba nghe, sẽ bảo "sến." Nhưng, đúng. V2 hồi sinh từ tro V1. Và, tôi đang cố hồi sinh từ phiên bản cũ của chính mình.
Commit message cuối cùng hôm nay:
git commit -m "v2.0-rc1: ready for demo day. built by 7 people who stayed."
7 người ở lại.
Đủ.