Căn bản về kiến trúc cơ sở hạ tầng, Phần 5: Phân phối nội dung và thiết kế mạng phân tán

Các khái niệm và kỹ thuật

Khám phá những phương pháp để phân phối nội dung và sự phân tán của đa phương tiện dựa trên Web trong thế giới Web 2.0.

Sam Siewert, Giáo sư, University of Colorado

Tiến sĩ Sam Siewert là một kiến trúc sư phần mềm và hệ thống, ông đã từng làm việc trong các ngành công nghiệp hàng không vũ trụ, viễn thông, cáp số, và lưu trữ. Ông cũng giảng dạy Chương trình Chứng chỉ về Hệ thống Nhúng (Embedded Systems Certification Program) tại trường đại học Colorado ở Boulder. Những nghiên cứu của ông chủ yếu thuộc các lĩnh vực: điện toán hiệu năng cao (HPC), mạng băng thông rộng, truyền thông thời gian thực, môi trường học từ xa, và các hệ thống nhúng thời gian thực



16 10 2009

Khái niệm về lưu trữ Web tạm thời đã tồn tại cùng với Web và có liên quan tới từ việc lưu trữ những tệp tin truy cập thường xuyên trên hệ thống máy tính cá nhân hoặc máy chủ ủy quyền (proxy) đến những máy chủ lưu trữ Web tạm thời dựa trên mạng Internet được cung cấp bởi các công ty như là một dịch vụ thuê bao trả tiền cho những nhà cung cấp nội dung. Khi đa phương tiện trở nên phổ biến hơn trên Web, những mạng phân phối nội dung (CDNs) đã trở thành một phần quan trọng của Internet và thành phần cho phép những ứng dụng Web 2.0 như IPTV, những thiết bị TV và Web di động, và những cơ sở dữ liệu Web nội dung lớn như Wikimedia hoạt động.

Những từ viết tắt được sử dụng thường xuyên

  • ACL: Danh sách kiểm soát truy cập (Access control list)
  • GUI: Giao diện người dùng đồ họa (Graphical user interface)
  • HTML: Ngôn ngữ Đánh dấu Siêu văn bản (Hypertext Markup Language)
  • HTTP: Giao thức Truyền Siêu văn bản (Hypertext Transfer Protocol)
  • I/O: Vào/ra (Input/output)
  • ISP: Nhà cung cấp dịch vụ Internet (Internet service provider)
  • RAID: Mảng dư thừa của những đĩa độc lập (Redundant array of independent disks)
  • SOA: Kiến trúc Hướng Dịch vụ (Service-Oriented Architecture)
  • UDP: Giao thức gói dữ liệu người dùng (User Datagram Protocol)
  • URI: Định danh tài nguyên thống nhất (Uniform resource identifier)
  • XML: Ngôn ngữ đánh dấu mở rộng (Extensible Markup Language)

Tiếp tục loạt bài Căn bản về kiến trúc cơ sở hạ tầng, đây là bài viết thứ năm cung cấp tổng quan về CDNs và những mạng phân tán. Nó cũng trình bày làm thế nào để chúng phát triển từ những nơi lưu trữ Web đơn giản để tối ưu hóa truy cập vào nội dung trên Web tới hệ thống quản lý nội dung phức tạp và thậm chí có trí tuệ. Hầu hết chúng ta sử dụng Web từ khi bắt đầu của trình duyệt Web (khoảng đầu những năm 1990), nhớ rằng những trình duyệt Web luôn có lựa chọn để lưu trữ nội dung Web truy cập hiện tại hoặc thường xuyên. Cuối những năm 1990, nhiều công ty mới dựa trên nền Web, đã khởi xướng những máy chủ lưu trữ Web dựa trên Internet như là một dịch vụ thuê bao mất phí cho những nhà cung cấp nội dung Web. Mạng những máy chủ lưu trữ này được biết đến là một mạng phân tán nội dung và cải thiện đáng kể hiệu suất truy cập nội dung Web của người sử dụng. Những dịch vụ phân tán cơ bản đã phát triển đáng kể bao gồm cả an ninh cho những nhà cung cấp nội dung và luồng đa phương tiện và sau đó được biết đến như là một mạng phân phối nội dung, với sự tập trung không chỉ từ phân tán mà còn phân phối những dịch vụ có nội dung lớn, bao gồm cả video, âm thanh và những cơ sở dữ liệu đa phương tiện.

Ngày nay để thiết kế kiến trúc những dịch vụ Web một hệ thống phân phối nội dung, phạm vi của hệ thống CDN đang đe dọa cả ở tính có thể mở rộng và ở tính đa dạng của những dịch vụ, những kiểu truyền thông, và hiệu suất truy cập mà ta hi vọng những hệ thống này sẽ cung cấp. Một trong những mục tiêu đã định rõ của Web 2.0 (World Wide Web thế hệ thứ hai) là trí tuệ đám đông. Mặc dù trí tuệ đám đông có lẽ là một mục tiêu không thực tế của Web 2.0, thời cơ kinh doanh quan trọng tồn tại và được chứng minh bằng sự nổi lên của những mạng xã hội, video vi rút, IPTV, phương tiện và dịch vụ Web di động, và việc chèn các quảng cáo vào trong tất cả những thứ này. Rõ ràng, những nhà cung cấp nội dung sẽ tính đến những CDNs được thiết kế hợp lý hơn nữa để liên lạc với người sử dụng. Bài viết này trang bị cho nhà thiết kế hệ thống và kiến trúc giải pháp với những phương pháp để thành công trong thiết kế của những hệ thống phân phối và phân tán nội dung với con mắt hướng tới tương lai của những gì mà những hệ thống này có thể trở thành.

Phạm vi và sự lành mạnh của Internet ngày nay

Trí tuệ đám đông

Theo thời gian, Internet đã phát triển từ một mạng đơn giản mà trên đó chia sẻ các tệp tin và giao tiếp qua thư điện tử đến mạng thông tin World Wide Web, nó nhanh chóng được hậu thuẫn bởi những máy chủ lưu trữ phức tạp và cuối cùng là CDNs. Do sự phong phú của nội dung, tri thức con người và sự tương tác trên Web, nó trở thành một mối liên hệ cho trí tuệ đám đông. Trí tuệ đám đông chính xác là cái gì thì có thể bị tranh luận, nhưng hầu hết đồng ý rằng trí tuệ yêu cầu phương tiện phong phú mà phù hợp với sự nhận biết và trải nghiệm cảm xúc của con người, bao gồm video, âm thanh và văn bản cái mà có thể tương tác được. Web 2.0 hứa hẹn sẽ làm phong phú thêm nội dung video và âm thanh thời gian thực có độ rõ nét cao nhiều hơn cùng với những cơ sở dữ liệu tri thức lớn có thể hỗ trợ các cấp độ mới của sự phối hợp, sự thao tác, sự cộng tác và sự nhận thức của con người.

Trung tâm về Trí tuệ đám đông của Viện Công nghệ Massachusetts (MIT) phát biểu rằng, "Câu hỏi nghiên cứu cơ bản của chúng ta là: Làm thế nào để con người và máy tính có thể được kết nối sao cho — một cách tập thể — chúng hoạt động thông minh hơn bất kì các cá nhân, các nhóm hoặc các máy tính đã từng làm được trước đó?" Từ mục tiêu đã phát biểu này, rõ ràng là sự truy cập, tương tác và phạm vi của dịch vụ và nội dung dựa trên Web sẽ là rất quan trọng cho trí tuệ đám đông.

Từ năm 2000 đến 2008, việc sử dụng Internet đã tăng với hơn 100 phần trăm ở Bắc Mỹ, với hơn 200 phần trăm ở Châu Âu, và hơn 400 phần trăm ở Châu Á. Sự bùng nổ mạnh mẽ ở Châu Phi và vùng Trung Đông vượt quá 1000 phần trăm ở cả hai khu vực này. Mặc dù tốc độ tăng trưởng cao này vẫn tiếp tục được duy trì, sự bão hòa vẫn chưa đạt được ngay cả ở Bắc Mỹ, trong đó hơn 70 phần trăm dân số sử dụng Internet (xem Tài nguyên). Tất nhiên, một mình việc truy cập và việc tiếp cận không phải là thước đo thành công. Chất lượng của trải nghiệm Internet được đo bởi tốc độ dữ liệu băng thông rộng, độ trễ truy cập, và sự phong phú của nội dung cũng là điều quan trọng.

Danh sách 500 trang Web hàng đầu thế giới cho thấy một xu hướng đáng chú ý (xem Tài nguyên). Nhìn vào bảng xếp hạng Alexa, không có gì ngạc nhiên là hai trang Web hàng đầu là những dịch vụ tìm kiếm Web. Có thể thấy rõ hơn sự thật là trong tốp 10 bạn tìm thấy mạng xã hội, bộ sách bách khoa, blogger, và những dịch vụ Web video lan truyền trên Internet. Cũng chú ý rằng nhiều trang web mới nổi dùng nội dung của người sử dụng, bao gồm cả văn bản từ những bloggers cũng như những hình ảnh (ví dụ, photobucket.com) hoặc video (ví dụ, youtube.com). Rõ ràng là xu hướng và cuộc cách mạng Internet thứ hai thường được biết đến là Web 2.0 sẽ bao gồm nội dung phong phú, sự tương tác người sử dụng lớn hơn, phương tiện thời gian thực, và cộng tác người sử dụng hơn nữa — sao cho người sử dụng không chỉ sử dụng nội dung mà còn tạo ra nó.

Các thành phần của một CDN

Những dịch vụ Web phát triển từ những dịch vụ Web có thể mở rộng — được biểu diễn trong Hình 1— cho những hệ thống phức tạp hơn nhiều chẳng hạn như Wikimedia CDN (xem Tài nguyên). Sự tiến hóa từ những máy chủ Web đơn lẻ có thể mở rộng đến những máy chủ nội dung phân tán — được biểu diễn trong Hình 2— có nhiều ưu điểm.

Hình 1. Ví dụ về những dịch vụ Web truyền thống
Những dịch vụ Web truyền thống
Hình 2. Ví dụ về những dịch vụ phân phối nội dung
CDN

Thứ nhất, những máy chủ nội dung có để được đặt chỗ thích hợp về mặt địa lý sao cho những máy khách được phục vụ tốt hơn trong khu vực cho trước với độ trễ thấp và để giảm những xung đột về lưu lượng tắc nghẽn trên những mạng xương sống. Những CDNs trước đây thường được gọi là những máy chủ biên bởi vì vị trí của chúng gần với người sử dụng và được coi là những máy chủ phân tán, bởi vì một trong những mục tiêu chính là loại bỏ sự tắc nghẽn mạng và cải thiện trải nghiệm của người sử dụng. Mới đây, khi sự phong phú của nội dung Internet phát triển bao gồm đa phương tiện thời gian thực, CDNs được biết đến như là những mạng phân phối nội dung bởi vì nhiều hệ thống trở nên chuyên dụng hơn để cung cấp không chỉ sự phân tán các tệp tin tốt hơn mà còn luồng phương tiện thời gian thực tốt hơn.

Mặt khác, xu hướng gần đây là mở rộng CDNs tới chính người sử dụng sao cho những máy tính cá nhân có thể tham gia vào sự phân tán với những dịch vụ ngang hàng (P2P) (xem Tài nguyên). Vài điều tiên quyết chính đối với một người thiết kế CDN là cấp độ CDN nào sẽ bao gồm các đặc tính P2P, hoặc dù CDN sẽ là hệ thống phân tán của những máy chủ truyền thống hơn và CDN gắn những chuẩn phương tiện gì. Cho dù những mục tiêu thiết kế CDN là gì, một CDN nên có những dịch vụ cơ bản sau:

  • Những nơi lưu trữ Web: Ví dụ, Squid
  • Những máy chủ cơ sở dữ liệu: Ví dụ, MySQL hoặc những cơ sở dữ liệu thương mại như IBM® DB2®
  • Những máy chủ Web: Ví dụ, Apache
  • Quản trị CDN: Tác giả nội dung, chuyển mã, và các công cụ quản trị; cấu hình IT, sự giám sát, và quản trị; kiểm tra lỗi; và v.v..
  • Lưu trữ truy cập cao: Các mảng RAID, ổ đĩa thể rắn (SSD), cũng như lưu trữ và truy cập phân tán P2P
  • Những đầu lưu trữ kết nối mạng (NAS): Những máy chủ tệp tin để hỗ trợ cho những máy khách khác nhau, bao gồm Linux®, UNIX®, Mac OS X, và Windows®

Rõ ràng là những dịch vụ Web tập trung, như trong Hình 1, sẽ dẫn đến sự tắc nghẽn mạng khi những máy khách trên toàn thế giới được gửi qua mạng xương sống để liên lạc với máy chủ đơn lẻ. Dù là máy chủ Web đó có thể được mở rộng về băng thông mạng, xử lý, và lưu trữ I/O để duy trì, trải nghiệm người dùng sẽ trở nên tồi tệ bởi những lần đợi chờ trong hằng đợi và sự tải vào mạng xương sống. Một trong những giải pháp trước tiên cho vấn đề này ở Web 1.0 là sử dụng những nơi lưu trữ Web địa phương với các trình duyệt máy khách cụ thể. Điều này đã làm tốt khi nội dung tổng hợp trên Internet không quá phong phú và đa dạng; nhưng ngày nay, hầu hết người dùng trình duyệt với phạm vi nội dung rộng lớn hơn nhiều trên nhiều trang hơn những gì mà họ đã làm ở những năm 1990. Trình duyệt của những nội dung mở rộng như vậy dẫn đến việc dùng những máy chủ ủy quyền lưu trữ nội dung Web cho những máy khách chính giống như một trường đại học (và trong vài trường hợp sẽ lọc ra nội dung truy cập). Cả lưu trữ máy khách và lưu trữ máy chủ ủy quyền cũng không giải quyết vấn đề thời gian chờ đợi đối với những người dùng của hầu hết những nhà cung cấp nội dung phổ biến như truy cập Internet và nội dung toàn bộ tăng lên. Yêu cầu cho sự tiến triển của CDNs là sự nạp vào phân tán hơn trên mạng Internet như một tổng thể cho những trang phổ biến nhất.

Khi so sánh, Hình 2 cho thấy một sự phân tán về mặt địa lý của CDNs đơn giản để thay thế cho những máy chủ Web tập trung đã biểu diễn trong Hình 1. Thiết kế mới này thêm vào một số sự phức tạp cho việc quản trị toàn bộ trang Web, bởi vì nó yêu cầu phân tán nội dung trong phạm vi tập những máy chủ CDN đã phân tán từ nội dung máy chủ gốc. Tuy nhiên, CDNs có thể phân tán nội dung qua những mạng riêng với việc đảm bảo chất lượng dịch vụ (mặc dù mạng Internet vẫn có thể được sử dụng) và có thể phân phối nội dung đó với số lượng lớn, với sự tương tác truy cập để nó bị đẩy đến biên của những máy chủ CDN. Những máy khách có thể vẫn kết nối đến miền và được định tuyến tới vùng CDNs của chúng để tương tác và truy cập. Với dự báo và đo lường cẩn thận của những thống kê truy cập vào mỗi vùng biên của những máy chủ CDN, bạn có thể mở rộng những máy chủ biên một cách độc lập để đáp ứng yêu cầu địa phương và để làm giảm tắc nghẽn mạng Internet xương sống. Hơn nữa, bạn có thể lập lịch phân tán nội dung mới từ những máy chủ gốc trong suốt thời gian sử dụng không cao điểm, và sử dụng sự khác nhau của các vùng thời gian để cân bằng việc tải mạng và máy chủ theo thời gian và địa điểm.

Những kỹ năng và khả năng: Cấu hình

Những nút trong một CDN bao gồm nội dung đã giấu kín cũng như nội dung được lưu trữ và thường là một cơ sở dữ liệu chẳng hạn như MySQL. Nội dung lưu trữ yêu cầu chứa đựng một lượng lớn luồng truyền tải của video hoặc âm thanh chẳng hạn như MPEG-2 và MPEG-4, cũng như XML và HTML có nhúng các ảnh JPEG nội dung lớn chẳng hạn. Sự tiêu thụ thường được thực hiện qua đầu NAS trên một SAN RAID cho CDNs tỉ lệ lớn. Đầu NAS cung cấp cho các tác giả nội dung, những người biên tập hậu sản xuất, và những nhà quản lý nội dung hoặc những nhà phân phối máy khách truy cập tới những tệp tin hệ thống có thể mở rộng mà họ có thể cần.

Nội dung trên một CDN thường gồm hàng trăm hoặc hàng nghìn tệp tin truyền tải video hoặc âm thanh mà chúng có kích thước nhiều gigabyte, do đó những nhu cầu lưu trữ thường có quy mô terabyte, và ngày nay trong một vài trường hợp là quy mô petabyte. Như đã thảo luận trong "Căn bản kiến trúc cơ sở hạ tầng, Phần 2: Phát hiện, ngăn ngừa, và loại trừ những tắc nghẽn hệ thống", (xem Tài nguyên) nhiều nhà thiết kế CDN đưa ra những công nghệ giống như kho lưu trữ xếp thành hàng và SSDs với kho lưu trữ RAID có thể mở rộng cho biên tập nội dung, quản trị, và những cụm NAS phân tán. Sự phong phú của nội dung trên CDNs tiếp tục phát triển với việc kết hợp video độ nét cao, thường là 20 đến 50Mbps trong dạng nén MPEG-2, MPEG-4, hoặc luồng truyền tải VC-1, so sánh với định nghĩa chuẩn, mà phổ biến là 3.75Mbps hoặc ít hơn. Loại trừ I/O và những tắc nghẽn truy cập lưu trữ do đó trở thành một trong những cân nhắc thiết kế quan trọng nhất đối với những CDNs có thể mở rộng để lưu trữ nội dung phong phú.

Những công cụ và kỹ thuật: Cấu hình lưu trữ Web tạm thời

Lưu trữ Web tạm thời Squid là một công cụ tuyệt vời cho CDNs để phục vụ khách hàng tốt hơn và để làm giảm sự tắc nghẽn mạng Internet và mạng nội bộ cho những dịch vụ Web nội dung phong phú được lưu trữ trên hệ thống Windows hoặc Linux. Dịch vụ Lưu trữ Web tạm thời Squid cung cấp cấu hình cho CDN bao gồm:

  • Kiểm soát truy cập: Với hơn 25 kiểu ACL khác nhau sắp xếp từ những địa chỉ IP nguồn đến những tên của người dùng và các cổng TCP
  • Nơi lưu trữ tệp tin và hệ thống tệp tin điều chỉnh: squid.conf chỉ định cho những thư mục lưu trữ và lược đồ (kiểu hệ thống tệp tin chẳng hạn như UFS, hệ thống tệp tin UNIX), định cỡ, và những chính sách lưu trữ tạm thời. Điều chỉnh cẩn thận những hệ thống tệp tin và những giao diện thiết bị khối là điều then chốt. Ví dụ, bạn có thể tăng đầu đọc cho một một giao diện khối để lưu trữ với lệnh blockdev --setra 4096, nó thiết lập đầu đọc lên đến 2MB. Tương tự như vậy, những hệ thống tệp tin như XFS có thể thích nghi tốt hơn với nội dung lưu trữ hơn là những hệ thống tệp tin UNIX truyền thống.
  • Sự ngăn chặn và các giao diện Squid-to-Squid: Trong trường hợp lưu lượng trên CDN được định tuyến đến Squid mà không có bất kỳ cấu hình máy khách đặc biệt nào, nhưng những bộ định tuyến trong CDN được cấu hình để chuyển hướng những kết nối HTTP đến máy mà trên đó có một Squid đang chạy, nó cũng yêu cầu cấu hình của bảng IP trên Linux để xử lý những kết nối được ngăn chặn.
  • Những bộ chuyển hướng URI: Sử dụng Squid, những bộ chuyển hướng URI có thể được sử dụng để thay đổi trang HTTP của một người dùng yêu cầu đến một trang mới.
  • Xác thực: Squid cung cấp vài phương thức để quản lý tên và mật khẩu người dùng cho các giao diện Web, bao gồm những phương thức htpasswd cơ bản trên những máy chủ Web phổ biến cũng những những phương thức cao cấp hơn.
  • Các nhật ký và giám sát: Các toán tử Squid có thể được quản lý thông qua các tệp tin nhập ký, bao gồm cache.log, access.log, store.log, và những nhật ký tùy chọn thêm vào mà bạn có thể cấu hình. Những tệp tin nhật ký này cung cấp những cảnh báo để cho biết khi nào Squid không được cấu hình hoặc đang chạy một cách hiệu quả.

Phân phối nội dung với phân tán nội dung

Web đã phát triển từ các văn bản gốc và các hình ảnh là đặc trưng chung của Web 1.0 trong những năm 1990 đến nội dung video và âm thanh thời gian thực chất lượng cao phong phú hơn trong thiên niên kỷ mới, Web 2.0 được hình dung không như những tệp tin và hình ảnh phân tán tới máy tính cá nhân mà là phân phối các phương tiện thời gian thực tới một phạm vi lớn các máy tính để bàn và các thiết bị di động.

Các hệ thống phân phối và tương tác nội dung đa phương tiện

Khi CDN phát triển từ những mạng phân tán truy cập tệp tin đến những mạng phân phối đa phương tiện, độ phức tạp của việc thiết kế một CDN trở nên lớn hơn. Những nguyên lý tương tự cũng đã làm CDN thành công cho phân tán tệp tin sẽ hữu ích với việc tiêu thụ nội dung và luồng đa phương tiện, bởi vì cả hai rất có ích từ độ trễ thấp hơn, tắc nghẽn ít hơn, và cân bằng tải tổng thể. Những nhà thiết kế CDN và cá nhân IT CDN sẽ phải tìm hiểu những chuẩn và công cụ mới cho quản lý, phân tán, sáng tác, chuyển mã và giám sát nội dung đa phương tiện. Những máy khách di động làm phức tạp vấn đề này hơn. Ví dụ, Digital Video Broadcasting-Handheld (DVB-H), MediaFLO, và những chuẩn Multimedia Broadcast Multicast Service (MBMS) cho phân phối nội dung Web và phương tiện số cho những thiết bị di động đã và đang nổi lên trong cạnh tranh. Sự hiện diện của chúng có thể yêu cầu CDN để hỗ trợ những chuẩn phân phối đa phương tiện di động và những định dạng dữ liệu.

Tương tự, mã hóa video và những luồng truyền tải có thể gồm MPEG-2, MPEG-4, VC-1, hoặc định dạng mã hóa Ogg/Theora mở. Tương tự như vậy, với âm thanh MP3 hoặc AC-3 — chưa nói đến những định dạng âm thanh chất lượng cao và mã hóa. Luồng thực, nơi mà nội dung video và âm thanh số được phân phối ở thời gian thực, khác xa so với hướng tiếp cận tải về-và-chạy của video lan truyền trên Internet ngày nay. Sự xuất hiện của IPTV với video theo nhu cầu thực tế vượt quá khả năng CDN hiện hành. Nhưng CDNs có thể được mở rộng và chắc chắn đóng vai trò quan trọng trong việc cung cấp nội dung ở thời gian thực, những nhu cầu đầu cuối cung cấp luồng thời gian thực chính xác. Những mạng trò chơi tương tác và những mạng xã hội mới hiện nay yêu cầu CDNs, chúng có thể đóng vai trò trong phân tán nội dung của người sử dụng và những trò chơi mới trên toàn cầu.

Những kỹ năng và khả năng: Thiết kế cho video và âm thanh

Quản lý nội dung bao gồm nhiều bước và tiến trình bên ngoài CDN, bao gồm xử lý hậu-sản xuất và phân phối chẳng hạn như những luồng truyền tải mã hóa hoặc chuyển mã chúng giữa những định dạng hoặc chuyển đổi chúng từ tốc độ cao đến tốc độ thấp hơn. Cuối cùng, CDN phải có những giao diện chứa nội dung cho các khách hàng để hỗ trợ chuẩn bị nội dung cho phân phối. Nhiều nội dung là HTML và XML, nhưng luồng nội dung phong phú hơn cũng sẽ bao gồm những luồng truyền tải.

Luồng truyền tải đóng gói những luồng chương trình đã mã hóa như MPEG-2, trong đó tổ hợp lần lượt những luồng thành phần của video hoặc âm thanh. Ví dụ, một luồng chương trình có thể gồm một luồng video nguyên gốc và một hoặc hơn một luồng âm thanh. Tương tự như vậy, một luồng truyền tải có thể gói gọn một chương trình đơn hoặc những luồng đã lên chương trình trong một Multiprogram Transport Stream (MPTS). Những luồng truyền tải này thường hỗ trợ theo nhu cầu hơn là tải về và đóng gói luồng, vì vậy CDNs thực hiện những định dạng tệp tin phù hợp với những người dùng phương tiện chẳng hạn như Windows Media Player. Người dùng phương tiện thông thường nhất cũng bao gồm cả khả năng quản lý bản quyền kỹ thuật số nhằm bảo vệ nội dung để những người dùng thực tế đã bỏ tiền mua nội dung mới được tiêu thụ nó.

Những phương thức để phân phối nội dung từ đầu cuối đến đầu cuối đang phát triển với tốc độ nhanh, đặc biệt cho phân tán nội dung di động trên những mạng điện thoại di động thế hệ thứ ba tới những thiết bị cầm tay và di động. Hầu hết những dịch vụ phân phối và xếp luồng bao gồm những đầu cuối (headend) độc quyền và các thiết bị của người dùng sẽ yêu cầu sự tích hợp vào thiết kế CDN tổng thể lớn. Bài viết "SoC drawer: SoCs and the digital content revolution" (xem Tài nguyên) có thể giúp ích cho người đọc muốn đào sâu hơn về vấn đề phân phối phương tiện thời gian thực để tới nhiều thiết bị người dùng nhúng hơn.

Những công cụ và công nghệ: Máy chủ VLC

Máy chủ VLC cung cấp công cụ mã nguồn mở tuyệt vời dựa trên Windows- hoặc Linux cho việc chuyển mã và cung cấp những dịch vụ luồng trên UDP. Mặc dù hầu hết những hệ thống phân phối nội dung gồm DRM và mã hóa độc quyền, máy chủ VLC cung cấp một phương thức để quản lý và phân phối nội dung nguồn mở. Số lượng nội dung nguồn mở sẵn có là nhỏ, nhưng những máy chủ nguồn mở và những công cụ giống máy chủ VLC kết hợp với nội dung nguồn mở chẳng hạn như W6RZ có thể rất hữu ích cho việc kiểm thử CDNs và tìm hiểu về quản lý phân phối nội dung thời gian thực (xem Tài nguyên).

VLC trói buộc máy khách và máy chủ với nhau và cung cấp những giao diện dựa trên GUI cũng như những giao diện tập lệnh cho luồng trên UDP và cho việc chuyển mã chương trình MPEG và những luồng truyền tải. Những nhà thiết kế CDN chọn hướng tiếp cận mã nguồn mở hoặc tích hợp cả DRM-ed độc quyền và phân phối nội dung nguồn mở có thể muốn theo kịp với những tiến bộ của LinuxMCE (xem Tài nguyên).

P2P CDNs

Sự nổi lên của mạng ngang hàng P2P đã được nhiều người biết đến qua tranh luận xung quanh những mạng chia sẻ tệp tin âm thanh số MP3 và quản lý bản quyền số (DRM) của nội dung đó. Sự phân tán nội dung P2P tiếp tục gây tranh cãi, bởi vì nó chuyển đổi điện toán của người thành cả máy chủ và máy khách, cái mà nhóm IT cục bộ đang cố quản lý những tài nguyên của máy khách và máy chủ của họ có thể không mong muốn. Tuy nhiên, CDNs hưởng lợi một cách rõ ràng từ việc đẩy nội dung đến biên, và kết quả tự nhiên là chuyển nội dung theo tất cả các cách để đến người sử dụng. Trong một tổ chức, những dịch vụ P2P cũng có thể tương đối hữu ích, bởi vì việc chia sẻ nhiều nội dung sẽ cùng nằm trong nhóm người dùng cùng địa phương một cách tự nhiên. Tương tự, nhiều hệ thống máy khách nhàn rỗi trong suốt những giờ không cao điểm và có thể được dùng cho việc tính toán, I/O, và lưu trữ các tài nguyên còn điều ngược lại sẽ gây ra lãng phí. Nói chung, P2P sẽ có chỗ đứng, nhưng nó phải được cân đối với vấn đề an ninh, cạnh tranh tài nguyên, và những vấn đề DRM.

Nhìn về tương lai

Sự tăng trưởng của các nhà cung cấp dịch vụ CDN và các nhà cung cấp thiết bị đã bùng nổ khi Web 2.0 nổi lên và dự kiến sẽ còn tiếp tục. Trong suốt sự hình thành của Internet, sự phát triển của các ISPs cũng tương tự và ngày nay đã được hợp nhất vào những tổ chức đa dịch vụ (MSOs) cung cấp cáp, vệ tinh, và các công ty mạng viễn thông. Theo truyền thống, nội dung đến từ các nhà cung cấp nội dung giống như mạng lưới truyền hình, Hollywood, hoặc các nhà xuất bản; nhưng rõ ràng, cuộc cách mạng về nội dung của người dùng, P2P đang thay đổi một cách đáng kể mô hình này.

Nói chung, Web 2.0 được hình dung là trải nghiệm người dùng tương tác hơn nữa, bao gói hơn và tốt hơn, với nội dung phong phú hơn không chỉ đến từ nhà cung cấp nội dung truyền thống mà còn từ nhiều nguồn nội dung khác, bao gồm mỗi người và mọi người trong chúng ta. Điều này sẽ giúp củng cố sự cần thiết cho CDNs để chứa nội dung trong khu vực và để phân phối nội dung đó cho các máy chủ biên của khu vực khác dựa trên các mẫu truy cập, như là một mặt cắt rộng lớn hơn của liên lạc và cộng tác của nhân loại trên Internet. Có thể nói một cách chắc chắn rằng tại thời điểm này, CDNs sẽ phát triển về tầm quan trọng, và sẽ yêu cầu những nhà thiết kế rất hiểu biết như mong đợi vào hiệu suất, tính đa dạng nội dung, và phạm vi rộng hơn những máy khách di động và truyền thống tận dụng CDNs.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

  • Danh sách những dịch vụ CDN và phần mềm từ web-caching.com có thể hữu dụng cho những nhà thiết kế phân phối nội dung xem xét sử dụng lại hoặc xây dựng một CDN riêng của họ.
  • Những công cụ VLC và máy khách/máy chủ có thể được tải về từ trang Web VideoLAN Media Player cho hệ điều hành Windows hoặc Linux.
  • Triển khai những dịch vụ và ứng dụng dựa trên Web trong SOA có thể được tiến hành bằng việc sử dụng phần mềm IBM WebSphere® .
  • Tải về Những phiên bản đánh giá sản phẩm của IBM và nắm trong tay bạn những công cụ phát triển ứng dụng và những sản phẩm phần mềm trung gian từ DB2, Lotus®, Rational®, Tivoli®, và WebSphere.

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=SOA và dịch vụ Web
ArticleID=437489
ArticleTitle=Căn bản về kiến trúc cơ sở hạ tầng, Phần 5: Phân phối nội dung và thiết kế mạng phân tán
publish-date=10162009