Kỷ nguyên của những dòng code được "trợ giá" bởi túi tiền không đáy của các ông lớn công nghệ đang đi đến hồi kết. GitHub, nền tảng lưu trữ mã nguồn lớn nhất thế giới thuộc sở hữu của Microsoft, vừa giáng một đòn mạnh vào cộng đồng lập trình viên khi thông báo chuyển đổi toàn bộ hệ thống tính phí của Copilot sang mô hình dựa trên lưu lượng sử dụng (usage-based billing). Bắt đầu từ ngày 1/6/2026, mọi thao tác từ autocomplete đơn giản đến các phiên làm việc phức tạp với AI Agent sẽ được quy đổi ra "GitHub AI Credits".
Cú sốc "Multiplier": Khi Opus đắt gấp 27 lần
Thông tin từ trang chủ GitHub Blog xác nhận một sự thay đổi nghiệt ngã: mức giá thuê bao tháng 10 USD (Pro) hoặc 39 USD (Pro+) vẫn giữ nguyên, nhưng giá trị sử dụng thực tế đã bị "bốc hơi" qua hệ số nhân (multiplier). Nếu trước đây người dùng có thể thoải mái sử dụng các model hàng đầu, thì giờ đây, mỗi lựa chọn đều đi kèm một hóa đơn vô hình.
"Starting June 1, your Copilot usage will consume GitHub AI Credits." (Nguồn: GitHub Blog)
Theo các tài liệu rò rỉ và phản hồi từ người dùng dùng thử, hệ số nhân cho mô hình Claude 3.5/4.6 Opus đã nhảy vọt từ mức 3x lên tới 27x. Ngay cả GPT-5.4, đứa con cưng của OpenAI, cũng ghi nhận mức tăng từ 1x lên 6x.

Người dùng @everfrustrated trên một diễn đàn công nghệ lớn đã cay đắng nhận xét:
"Current multipliers vs from June: Opus 4.6 3x -> 27x, GPT 5.4 1x -> 6x."
Đây không còn là một đợt điều chỉnh giá thông thường; đó là một cuộc thanh lọc. Với hệ số 27x, một tài khoản Pro 10 USD giờ đây có thể chỉ đủ để thực hiện vài chục câu lệnh phức tạp với Opus trước khi "cháy túi".
Tại sao "Bữa trưa miễn phí" lại kết thúc?
Lý do đằng sau quyết định này không khó đoán: Chi phí vận hành Agentic Coding đang trở nên quá tải. Khi các công cụ lập trình tự hành (AI Agents) xuất hiện, chúng không chỉ gợi ý một dòng code, mà còn quét toàn bộ codebase, chạy thử nghiệm và sửa lỗi liên tục. Một phiên làm việc như vậy có thể tiêu tốn hàng triệu token — thứ mà mức phí 10 USD/tháng không bao giờ có thể bù đắp được.
"People were running multi-hour agentic coding sessions for the same flat fee as a one-liner autocomplete, github was eating the bill, and that party's over on june 1st." (Trích bình luận của @immanuwell)
Thậm chí, nhiều "hacker" còn tận dụng lỗ hổng để chạy các kịch bản tự động hóa vô tận trên hạ tầng của GitHub, buộc Microsoft phải siết chặt quy trình để bảo vệ biên lợi nhuận. Sự dịch chuyển sang tính phí theo lưu lượng là cách duy nhất để GitHub duy trì tính bền vững, nhưng nó cũng đồng thời đẩy rủi ro tài chính về phía người dùng.
Cuộc đại di cư: Từ "ông lớn" sang "kẻ thách thức"
Phản ứng của cộng đồng lập trình viên diễn ra dồn dập và đầy phẫn nộ. Làn sóng hủy đăng ký Copilot đang lan rộng, nhường chỗ cho các nền tảng trung gian như OpenRouter hoặc các nhà cung cấp giá rẻ đến từ Trung Quốc như DeepSeek.
"I'm going to switch to a PAYG provider. If there's a month where there's little to no coding I can pocket the 10$." (Quan điểm của @Ilaurens)

Sự trỗi dậy của các giải pháp Local LLM (mô hình ngôn ngữ lớn chạy cục bộ) cũng là một hướng đi đáng chú ý. Với các dòng chip M3 Max hoặc GPU NVIDIA thế hệ mới, việc tự vận hành các mô hình như Llama 3 hay DeepSeek Coder đang trở thành lựa chọn kinh tế hơn hẳn so với việc trả "thuế token" cho Microsoft.
"I'm happy I invested in local solutions and cutting context to the bone for API providers. Claims about AI being able to fully replace programmers never took into account the long-run equilibrium price of inference." (Nhận định từ @bachmeier)
Sự thay đổi của GitHub không đơn độc. Trước đó, vào tháng 3/2026, Windsurf cũng đã thực hiện một bước đi tương tự khi thay thế hệ thống credit bằng hạn ngạch sử dụng nghiêm ngặt. Thị trường AI Coding đang phân cực rõ rệt: Một bên là các doanh nghiệp sẵn sàng chi đậm để đổi lấy sự tích hợp sâu vào hệ sinh thái GitHub/Azure, và một bên là các lập trình viên độc lập đang phải thắt lưng buộc bụng hoặc tìm kiếm những "vùng đất mới" tự do hơn.
Cuối cùng, câu hỏi đặt ra là: Liệu năng suất lao động tăng thêm từ AI có đủ để bù đắp cho những hóa đơn token ngày càng phình to? Khi "bóng ma" chi phí hiện hình, lập trình viên sẽ phải học cách giao tiếp với AI một cách tiết kiệm và hiệu quả hơn, hoặc đơn giản là quay trở lại với những dòng code thủ công truyền thống. Kỷ nguyên của sự xa hoa đã chấm dứt; bây giờ là lúc để tính toán.