Mạng phân phối nội dung (CDN) là mạng máy chủ phân tán theo địa lý cùng phối hợp để cung cấp nội dung internet nhanh hơn và đáng tin cậy hơn. Thay vì tất cả người dùng đều truy cập nội dung từ một máy chủ gốc duy nhất, CDN lưu bộ nhớ đệm các bản sao của những tài nguyên tĩnh như hình ảnh, video, biểu định kiểu và tệp JavaScript trên các máy chủ đặt gần người dùng hơn trên khắp thế giới.

Hãy hình dung như một chuỗi bán lẻ. Thay vì tất cả mọi người đều phải đi đến một kho tổng trung tâm khổng lồ để mua sản phẩm, sẽ có các cửa hàng địa phương ở mọi thành phố với sẵn những mặt hàng phổ biến. Có được thứ mình cần nhanh hơn, còn kho trung tâm xử lý ít lưu lượng hơn.

Khoảng 46 triệu trang web sử dụng CDN(cửa sổ mới) trên toàn thế giới, bao gồm khoảng 81% trong số 1 triệu trang web hàng đầu(cửa sổ mới). Các nhà cung cấp CDN lớn bao gồm Akamai Technologies và Cloudflare hiện diện khắp nơi (chỉ riêng Cloudflare đã có hơn 24 triệu trang web sử dụng(cửa sổ mới)).

Vì sao CDN tồn tại?

Theo truyền thống, các trang web được lưu trữ trên một máy chủ duy nhất tại một vị trí vật lý. Điều này hoạt động tốt nếu tất cả khách truy cập đều sống gần máy chủ đó. Nhưng một khi người dùng phân tán ở nhiều quốc gia (hoặc châu lục), vấn đề sẽ xuất hiện:

  • Độ trễ (thời gian tải chậm do khoảng cách vật lý)
  • Nút thắt băng thông
  • Máy chủ quá tải trong các đợt tăng lưu lượng
  • Dễ bị tấn công DDoS(cửa sổ mới) hơn

CDN giải quyết điều này bằng cách phân phối nội dung trên nhiều máy chủ trên toàn thế giới. Điều này có nghĩa là nếu đang ở New York, nội dung sẽ được cung cấp từ một máy chủ đặt tại Mỹ, trong khi khách truy cập ở London vào cùng trang web đó sẽ được phục vụ nội dung từ một máy chủ tại châu Âu.

Lợi ích của CDN là gì?

CDN cải thiện:

  • Tốc độ: Nội dung phải di chuyển quãng đường vật lý ngắn hơn
  • Khả năng mở rộng: Các đợt tăng lưu lượng (ví dụ: trong đợt giảm giá hoặc sự kiện lan truyền) không làm trang bị sập
  • Thời gian hoạt động: Nếu một máy chủ gặp sự cố, máy chủ khác sẽ tiếp quản
  • Bảo mật: Hầu hết CDN giúp bảo vệ khỏi các cuộc tấn công DDoS

CDN hoạt động như thế nào?

Một CDN bao gồm:

  1. Một máy chủ gốc. Đây là máy chủ “chính” nơi trang web thực sự được lưu trữ.
  2. Máy chủ biên lưu trữ (“bộ nhớ đệm”) nội dung tĩnh như hình ảnh, tệp CSS, JavaScript và video từ máy chủ gốc. Các CDN lớn (như Cloudflare) có thể vận hành hàng trăm máy chủ biên phân tán như vậy trên khắp thế giới.
Sơ đồ hiển thị cách CDN hoạt động

Khi truy cập một trang web sử dụng CDN, quy trình hoạt động như sau:

  1. Yêu cầu của người dùng: Khi truy cập một trang web, trình duyệt sẽ gửi yêu cầu nội dung.
  2. Phân giải DNS: Hệ thống DNS của CDN xác định máy chủ nào ở vị trí phù hợp nhất để phục vụ. Thông thường, đó sẽ là máy chủ gần nhất.
  3. Kiểm tra bộ nhớ đệm: Máy chủ biên kiểm tra xem có nội dung được yêu cầu trong bộ nhớ đệm hay không.
  4. Phân phối: Nếu đã có trong bộ nhớ đệm, nội dung sẽ được cung cấp ngay lập tức. Nếu chưa có, máy chủ biên sẽ tìm nạp từ máy chủ gốc, lưu bộ nhớ đệm một bản sao cho các yêu cầu sau và cung cấp nội dung đó.
  5. Nội dung động: Đối với nội dung động (như các trang được cá nhân hóa), CDN có thể định tuyến yêu cầu đến máy chủ gốc trong khi vẫn tối ưu hóa đường dẫn kết nối.

Điều quan trọng là tất cả các trang web sử dụng cùng một CDN sẽ định tuyến nội dung qua các máy chủ biên dùng chung của CDN. Điều này có nghĩa là hàng trăm trang web vốn không liên quan đến nhau nhưng phục vụ cùng một khu vực địa lý có thể chia sẻ địa chỉ IP của một máy chủ biên CDN cho khu vực đó.

CDN và những nguy cơ của việc chặn quá mức

Để chống lại việc phát trực tuyến bất hợp pháp các trận bóng đá của mình, hiệp hội bóng đá hàng đầu Tây Ban Nha LaLiga đã có được lệnh của tòa án yêu cầu các nhà cung cấp dịch vụ internet tại Tây Ban Nha chặn hàng nghìn địa chỉ IP thuộc về nhà cung cấp CDN Cloudflare. Lý do là vì tổ chức này đã liên hệ các địa chỉ IP đó với các dịch vụ phát trực tuyến bất hợp pháp.

Các dịch vụ bị ảnh hưởng bởi việc chặn Cloudflare ở Tây Ban Nha

Vấn đề là các địa chỉ IP này thuộc về các máy chủ biên của Cloudflare, vốn cũng được hàng nghìn (có thể là hàng triệu) trang web hợp pháp sử dụng. Điều này khiến hàng triệu người ở Tây Ban Nha không thể truy cập ổn định một số trang phổ biến, bao gồm(cửa sổ mới) GitHub, ChatGPT, các trang web chính phủ và dịch vụ ngân hàng.

Nhận định cuối về CDN

Mạng phân phối nội dung hiện là hạ tầng thiết yếu cho web ngày nay, âm thầm cung cấp trải nghiệm trực tuyến nhanh, ổn định mà người dùng đã quen mong đợi. Bằng cách phân phối nội dung qua các máy chủ biên phân tán theo địa lý, CDN làm giảm độ trễ, hấp thụ các đợt tăng lưu lượng, cải thiện thời gian hoạt động và bổ sung các lớp bảo mật quan trọng.

Phần lớn giá trị của chúng nằm ở sự vô hình. Dù được hơn ba phần tư số trang web trên internet sử dụng, hầu hết mọi người thậm chí không nghĩ đến chúng. Nhưng chúng vẫn ở đó, hoạt động phía sau hậu trường của khoảng ba phần tư số trang web ngày nay, bảo đảm nội dung được truyền đến nhanh chóng và ổn định bất kể vị trí địa lý.

Những tình huống gần đây mà chính phủ, tòa án và lợi ích doanh nghiệp chặn các dịch vụ internet chắc chắn gây ra thiệt hại ngoài dự kiến đáng kể cho internet rộng lớn hơn.