Hướng dẫn Claude API cho Người mới bắt đầu: Hướng dẫn Bắt đầu Hoàn chỉnh
TL;DR: Claude API cho phép quý vị tích hợp các mô hình AI của Anthropic vào các ứng dụng của riêng mình. Hướng dẫn này đưa quý vị từ con số không đến mã làm việc — bao gồm xác thực, cuộc gọi API đầu tiên, phản hồi streaming, quản lý cuộc trò chuyện, sử dụng công cụ và các thực hành tốt nhất cho sản xuất — với các ví dụ Python và JavaScript có thể sao chép ngay lập tức.
Claude API là gì?
Claude API là giao diện lập trình của Anthropic để tích hợp các mô hình ngôn ngữ Claude trực tiếp vào các ứng dụng, kịch bản, quy trình làm việc và sản phẩm của quý vị. Thay vì sử dụng giao diện web Claude.ai, API cung cấp cho quý vị kiểm soát lập trình đầy đủ — quý vị gửi văn bản vào, nhận văn bản (hoặc dữ liệu có cấu trúc) trở lại, và quý vị quyết định chính xác cách ứng dụng của mình sử dụng nó.
API cung cấp năng lượng cho mọi thứ từ chatbot đơn giản đến các hệ thống đa tác nhân phức tạp. Các nhà phát triển sử dụng nó để xây dựng tự động hóa dịch vụ khách hàng, quy trình phân tích tài liệu, công cụ tạo mã, hệ thống kiểm duyệt nội dung, quy trình trích xuất dữ liệu, v.v. Bất kỳ tác vụ nào Claude có thể làm trong trình duyệt, nó cũng có thể làm qua API — được nhúng bên trong sản phẩm của riêng quý vị.
Tính đến năm 2026, API cung cấp quyền truy cập vào ba họ mô hình chính: Claude Opus 4.7 (có khả năng nhất, ngữ cảnh token 1M, lý tưởng cho suy luận phức tạp), Claude Sonnet 4.6 (hiệu suất cân bằng và tốc độ, tốt nhất cho hầu hết các khối lượng công việc sản xuất), và Claude Haiku 4.5 (nhanh nhất và rẻ nhất, hoàn hảo cho các tác vụ nhạy cảm về độ trễ với khối lượng cao). Mỗi mô hình đều có sẵn qua một điểm cuối API thống nhất duy nhất với định dạng yêu cầu/phản hồi nhất quán.
Giá cả dựa trên token — khoảng 750 từ bằng khoảng 1.000 token. Token đầu vào (những gì quý vị gửi) và token đầu ra (những gì Claude tạo ra) có giá riêng biệt, với giá đầu vào rẻ hơn. Một lệnh gọi API điển hình có thể sử dụng 500 token đầu vào và tạo ra 300 token đầu ra, chi phí chỉ hơn một xu. Claude API tiết kiệm chi phí đáng kể hơn so với giá cả trên mỗi ghế cho các khối lượng công việc sản xuất ở quy mô.
Nếu quý vị muốn thử nghiệm các khả năng của Claude trước khi cam kết chi phí API, FreeClaude cung cấp quyền truy cập miễn phí vào Claude Max x20 — cùng độ thông minh mô hình cơ bản — thông qua một chương trình giới thiệu không yêu cầu thẻ tín dụng.
Cài đặt Môi trường của Quý vị
Trước khi viết bất kỳ mã nào, quý vị cần ba thứ: tài khoản Anthropic, khóa API và SDK được cài đặt trong dự án của quý vị.
Bước 1: Tạo tài khoản Anthropic
Truy cập console.anthropic.com và đăng ký. Các tài khoản mới nhận được số dư tín dụng nhỏ để kiểm tra ban đầu — thường đủ cho hàng trăm lệnh gọi kiểm tra. Khi tín dụng được sử dụng hết, hãy thêm phương thức thanh toán. Giá API là theo lưu lượng truy cập với không có cam kết tối thiểu.
Bước 2: Tạo khóa API
Trong Bảng điều khiển Anthropic, điều hướng đến Cài đặt → Khóa API → Tạo Khóa. Đặt tên mô tả cho nó (ví dụ: "dev-local"). Sao chép khóa ngay lập tức — nó chỉ được hiển thị một lần. Lưu trữ nó trong trình quản lý mật khẩu hoặc trình quản lý bí mật như AWS Secrets Manager. Không bao giờ mã hóa khóa API trong mã nguồn.
Bước 3: Cài đặt SDK
Anthropic cung cấp SDK chính thức cho Python và TypeScript/JavaScript. Cả hai đều được bảo trì tích cực và được giữ đồng bộ với các bản phát hành mô hình mới.
# Python
pip install anthropic
# Node.js / TypeScript
npm install @anthropic-ai/sdk
Bước 4: Đặt khóa API của Quý vị làm Biến Môi trường
SDK tự động đọc biến môi trường ANTHROPIC_API_KEY:
export ANTHROPIC_API_KEY="sk-ant-..."
Đối với các dự án sử dụng tệp .env, hãy cài đặt python-dotenv (Python) hoặc dotenv (Node) và tải nó khi khởi động. Thêm .env vào .gitignore ngay lập tức — không bao giờ cam kết thông tin xác thực vào kiểm soát phiên bản.
Thực hiện Cuộc gọi API đầu tiên của Quý vị
Với môi trường của quý vị được cài đặt, đây là mã tối thiểu để thực hiện lệnh gọi API làm việc — "Hello World" của phát triển Claude API.
Python
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[
{"role": "user", "content": "Explain what an API is in two sentences."}
]
)
print(message.content[0].text)
JavaScript / Node.js
import Anthropic from '@anthropic-ai/sdk';
const client = new Anthropic();
const message = await client.messages.create({
model: 'claude-sonnet-4-6',
max_tokens: 1024,
messages: [
{ role: 'user', content: 'Explain what an API is in two sentences.' }
]
});
console.log(message.content[0].text);
Phân tích các tham số chính: model chỉ định mô hình Claude nào sẽ sử dụng. max_tokens giới hạn độ dài phản hồi — quá thấp sẽ cắt ngắn phản hồi, quá cao thì không lãng phí gì trừ khi Claude sử dụng các token đó. messages là một mảng các lượt trò chuyện, mỗi lượt có role (user hoặc assistant) và content.
Đối tượng phản hồi chứa một mảng các khối nội dung. Đối với các phản hồi văn bản tiêu chuẩn, văn bản nằm ở message.content[0].text. Phản hồi cũng bao gồm dữ liệu sử dụng: message.usage.input_tokens và message.usage.output_tokens — hữu ích cho việc theo dõi chi phí từ ngày đầu tiên.
Quản lý Cuộc trò chuyện Nhiều lượt
Claude API không có trạng thái — nó không lưu trữ lịch sử cuộc trò chuyện trên máy chủ. Ứng dụng của quý vị phải theo dõi cuộc trò chuyện và gửi lịch sử đầy đủ với mỗi yêu cầu.
import anthropic
client = anthropic.Anthropic()
conversation = []
def chat(user_message):
conversation.append({"role": "user", "content": user_message})
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=conversation
)
assistant_message = response.content[0].text
conversation.append({"role": "assistant", "content": assistant_message})
return assistant_message
print(chat("My name is Alex and I'm learning Python."))
print(chat("What's a good first project for someone like me?"))
print(chat("How long will that take to build?"))
Danh sách conversation phát triển với mỗi lượt, và danh sách đầy đủ được gửi với mỗi yêu cầu. Claude nhận bối cảnh hoàn chỉnh và có thể tham chiếu bất kỳ thứ gì được nói trước đó. Đối với các phiên rất dài, hãy triển khai tóm tắt: định kỳ yêu cầu Claude tóm tắt cuộc trò chuyện, sau đó thay thế lịch sử bằng bản tóm tắt đó để ở trong giới hạn cửa sổ ngữ cảnh.
Streaming Phản hồi Theo thời gian thực
Theo mặc định, API chờ cho đến khi phản hồi hoàn chỉnh được tạo trước khi gửi nó. Streaming giải quyết vấn đề này — quý vị nhận các token khi chúng được tạo ra, cho phép hiệu ứng máy chữ quý vị thấy trên Claude.ai và cải thiện đáng kể hiệu suất được cảm nhận.
Python Streaming
import anthropic
client = anthropic.Anthropic()
with client.messages.stream(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Write a detailed explanation of machine learning."}]
) as stream:
for text in stream.text_stream:
print(text, end="", flush=True)
print()
JavaScript Streaming
const stream = await client.messages.stream({
model: 'claude-sonnet-4-6',
max_tokens: 1024,
messages: [{ role: 'user', content: 'Write a detailed explanation of machine learning.' }]
});
for await (const chunk of stream.textStream) {
process.stdout.write(chunk);
}
console.log();
Phản hồi 500 từ mất khoảng 5–8 giây để tạo. Không có streaming, người dùng thấy một màn hình trống trong toàn bộ thời gian. Với streaming, họ bắt đầu đọc trong giây đầu tiên. Tổng thời gian tạo ra là giống nhau, nhưng trải nghiệm người dùng được chuyển đổi. Streaming là điều cần thiết cho bất kỳ ứng dụng nào hướng đến người dùng.
Sử dụng Công cụ và Gọi Hàm
Sử dụng công cụ cho phép Claude yêu cầu dữ liệu từ các hệ thống bên ngoài trong khi trò chuyện — cơ sở dữ liệu, API, hệ thống tệp — cho phép nó hoạt động với thông tin theo thời gian thực và thực hiện các hành động trên thế giới.
import anthropic, json
client = anthropic.Anthropic()
tools = [{
"name": "get_weather",
"description": "Get current weather for a city",
"input_schema": {
"type": "object",
"properties": {
"city": {"type": "string", "description": "City name"},
"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]}
},
"required": ["city"]
}
}]
def get_weather(city, unit="celsius"):
return {"temperature": 22, "condition": "sunny", "city": city}
messages = [{"role": "user", "content": "What's the weather in Paris?"}]
response = client.messages.create(
model="claude-sonnet-4-6", max_tokens=1024, tools=tools, messages=messages
)
if response.stop_reason == "tool_use":
tool_use = next(b for b in response.content if b.type == "tool_use")
result = get_weather(**tool_use.input)
messages.append({"role": "assistant", "content": response.content})
messages.append({"role": "user", "content": [
{"type": "tool_result", "tool_use_id": tool_use.id, "content": json.dumps(result)}
]})
final = client.messages.create(
model="claude-sonnet-4-6", max_tokens=1024, tools=tools, messages=messages
)
print(final.content[0].text)
Sử dụng công cụ cho phép truy vấn cơ sở dữ liệu, gọi API bên ngoài, đọc và ghi tệp, thực thi mã và tích hợp với các hệ thống kinh doanh. Claude quyết định khi nào gọi công cụ dựa trên yêu cầu của người dùng và mô tả của công cụ — văn bản mô tả là rất quan trọng, vì Claude đọc nó để xác định mức độ liên quan.
Chọn Mô hình Claude Phù hợp
Lựa chọn mô hình ảnh hưởng đáng kể đến cả chi phí và chất lượng. Mỗi mô hình có một hồ sơ hiệu suất riêng biệt phù hợp với các trường hợp sử dụng cụ thể.
Claude Haiku 4.5 — Nhanh nhất và rẻ nhất. Tốt nhất cho: phân loại, hỏi đáp đơn giản, kiểm duyệt, trích xuất dữ liệu từ văn bản có cấu trúc, xử lý hàng loạt có khối lượng cao. Thời gian phản hồi dưới 1 giây cho đầu ra ngắn.
Claude Sonnet 4.6 — Sự cân bằng tốt nhất giữa khả năng và chi phí. Xử lý: viết phức tạp, tạo mã, phân tích chi tiết, suy luận nhiều bước, trò chuyện hướng đến khách hàng. Mặc định đúng cho hầu hết các ứng dụng sản xuất — chất lượng gần như Opus với chi ph