Bắt đầu khóa học của bạn về dữ liệu lớn

Các khóa học miễn phí có các phòng thí nghiệm thực hành để bạn có thể chạy trên đám mây!

Hãy tìm hiểu về các khóa học trực tuyến, miễn phí hiện nay, có sẵn tại địa chỉ BigDataUniversity.com. Làm theo đường dẫn để bắt đầu và phát triển kiến thức của bạn về dữ liệu lớn (big data) và sẵn sàng thực hiện nó để đáp ứng các nhu cầu kinh doanh riêng của bạn.

Raul Chong, Nhà tư vấn cơ sở dữ liệu, IBM Toronto Laboratory

Raul Chong là một nhà tư vấn cơ sở dữ liệu của Phòng thí nghiệm Toronto của IBM và chủ yếu làm với Các đối tác kinh doanh của IBM. Raul đã làm việc trong sáu năm tại IBM, trong thời gian này có ba năm làm về Hỗ trợ kỹ thuật DB2 9.1 và ba năm làm tư vấn chuyên về phát triển và di chuyển cơ sở dữ liệu ứng dụng từ các RDBMS khác sang DB2 9.1.



20 09 2012

Giới thiệu

Không còn nghi ngờ gì nữa dữ liệu lớn và điện toán đám mây là hai chủ đề công nghệ thông tin nóng nhất hiện nay. Đòi hỏi các cá nhân có tay nghề cao trong các lĩnh vực này và tiền lương được chào mời đang tăng lên nhanh chóng. May mắn thay, cả hai lĩnh vực phần nào có liên quan, nên bạn có thể bắt đầu khóa học của mình về dữ liệu lớn và đồng thời trải nghiệm và tìm hiểu các khái niệm điện toán đám mây trong quá trình này. Mặc dù bạn có thể dành thời gian nghiên cứu các chủ đề này trên internet, nhưng có một cách tốt hơn và dễ dàng hơn là: Hãy khám phá các khóa học miễn phí tại Big Data University (trường Đại học dữ liệu lớn).

BigDataUniversity.com là một trang web giáo dục trực tuyến cung cấp các khóa học miễn phí về dữ liệu lớn và các cơ sở dữ liệu. Trang web được điều hành bởi cộng đồng trong đó có nhiều thành viên của IBM đóng góp tự nguyện để phát triển các khóa học và nâng cao trang web này. Hãy tìm hiểu @yourpace, @yourplace từ những thứ tốt nhất của ngành công nghiệp phần mềm là khẩu hiệu của họ. Điều hấp dẫn về Big Data University là ở chỗ hầu hết các khóa học có các phòng thí nghiệm thực hành để bạn có thể thực hiện trên đám mây. Ví dụ, một trong những khóa học trong Big Data University được tài trợ bởi Amazon Web Services (Các dịch vụ Web của Amazon) đang cung cấp một khoản tín dụng là 25 đô la để tìm hiểu dữ liệu lớn trên đám mây của họ. Mỗi khóa học trong Big Data University có một bài kiểm tra ngắn mà bạn có thể làm và nếu bạn vượt qua nó, bạn có thể tự in cho mình một chứng chỉ hoàn thành.

Bài này liệt kê các khóa học hiện đang có sẵn tại Big Data University và các khóa học này sẽ sớm được công bố. Mặc dù các khóa học đều không có các điều kiện tiên quyết nào, nhưng có đề xuất một hướng học tập để bạn có thể chọn chúng theo thứ tự.


Hướng học tập được đề xuất

Các khóa học của Big Data University được phân loại theo ba thể loại:

  • Các chủ đề liên quan đến dữ liệu lớn.
  • Các chủ đề liên quan đến (DB2) cơ sở dữ liệu.
  • Các chủ đề khác.

Các khóa học về các chủ đề liên quan đến dữ liệu lớn

Hình 1 cho thấy danh sách các khóa học về thể loại dữ liệu lớn và thứ tự đề xuất mà chúng tôi khuyên bạn nên chọn chúng (từ trên xuống dưới, rồi từ trái sang phải) tùy thuộc vào kiến thức hiện tại của bạn về các khái niệm dữ liệu lớn.

Hình 1. Các khóa học của Big Data University - Thể loại dữ liệu lớn
được mô tả dưới đây

Khóa học "Các trình diễn phân tích dữ liệu lớn - Big data analytics demos" ở trên cùng của hình vẽ này cung cấp một tổng quan về dữ liệu lớn là gì, tại sao nó lại quan trọng và các đặc điểm của nó. Nó cũng giới thiệu cho bạn các khái niệm về phân tích dữ liệu đã lưu trữ (data-at-rest) (hãy tưởng tượng giống như một đại dương: lượng dữ liệu khổng lồ, nhưng không thực sự dịch chuyển) và phân tích dữ liệu đang dịch chuyển (hãy tưởng tượng giống như một con sông hoặc một dòng suối: các luồng dữ liệu liên tục dịch chuyển và phải phân tích chúng trong thời gian thực).

Các khóa học ở bên trái của Hình 1 ("Những điều cơ bản về Hadoop I - Hadoop fundamentals I", " Hadoop và Đám mây của Amazon - Hadoop and the Amazon Cloud"," Hadoop và Doanh nghiệp Đám mây thông minh của IBM - Hadoop and IBM SmartCloud Enterprise" và " Những điều cơ bản về Hadoop II - Hadoop fundamentals II"), đang là bản beta, chủ yếu là để phân tích dữ liệu đã lưu. Các khóa học này dạy bạn cách làm việc với Hadoop, một khung công tác nguồn mở Java sẽ giúp bạn xử lý một lượng lớn dữ liệu một cách nhanh chóng. Lưu ý rằng các khóa học này có các phòng thí nghiệm để bạn có thể chạy hoặc trên Amazon Cloud hoặc trên IBM SmartCloud Enterprise. Chúng tôi đề nghị bạn nên chọn các khóa học trong phần này theo thứ tự đã liệt kê, từ trên xuống dưới.

Ở giữa Hình 1, có liệt kê ba khóa học:

  • "Phân tích như bảng tính - Spreadsheet-like analytics" (đang là bản beta) cho phép những người dùng không chuyên kỹ thuật tận dụng lợi thế của các công nghệ dữ liệu lớn mà không phải tìm hiểu cách viết một chương trình để chạy Hadoop, JAQL và v.v.. Nó sử dụng BigSheets, một trình cắm thêm có thể chạy trên đỉnh của Hadoop và được thiết kế cho người dùng doanh nghiệp, những người quen thuộc với các công cụ bảng tính như MS Excel.
  • "Những yếu tố cần thiết về phân tích văn bản I - Text Analytics Essentials I" dạy bạn những điều cơ bản về cách thực hiện phân tích dựa vào dữ liệu không theo cấu trúc, chẳng hạn như nội dung của một thư điện tử, hoặc bất kỳ tài liệu khác nào. Nó sử dụng Ngôn ngữ truy vấn chú giải (AQL - Annotation Query Language) để xác định cách lọc thông tin. Có thể sử dụng một trình cắm thêm Eclipse về phân tích văn bản để phát triển AQL mà sau này có thể được triển khai trên đỉnh của Hadoop để xử lý dữ liệu lớn.
  • "Ngôn ngữ truy vấn cho Hadoop - Query Languages for Hadoop" (đang là bản beta) dạy bạn cách làm việc với các ngôn ngữ truy vấn và kịch bản lệnh như Hive, Pig và JAQL. Các ngôn ngữ kịch bản lệnh này đơn giản hóa sự phát triển các chương trình map-reduce trong Hadoop cho các nhà phát triển chưa thành thạo về Java.

Ở bên phải của hình này, bạn thấy danh sách các khóa học sớm được công bố về phân tích dữ liệu đang dịch chuyển ("Điện toán luồng I - Stream computing I" và " Điện toán luồng II - Stream computing II", cả hai đang là bản beta). Các khóa học này sẽ thảo luận, ví dụ, cách phân tích các tin ngắn của tweet hoặc các nhận xét trên Facebook như dữ liệu đang dịch chuyển trong thời gian thực. Chúng cũng sẽ thảo luận cách thực hiện phân tích bản ghi nhật ký, xử lý sự kiện phức tạp và nhiều hơn nữa.

Các khóa học về các chủ đề liên quan đến cơ sở dữ liệu

Hình 2 cho thấy danh sách các khóa học về thể loại (DB2) cơ sở dữ liệu và thứ tự được đề xuất mà chúng tôi khuyên bạn nên chọn chúng (từ trên xuống dưới, từ trái sang phải) tùy thuộc vào kiến thức hiện tại của bạn về các khái niệm cơ sở dữ liệu.

Hình 2. Các khóa học của Big Data University - Thể loại (DB2) cơ sở dữ liệu
được mô tả dưới đây

Khóa học "Những điều cơ bản về SQL I - SQL fundamentals I " ở trên cùng của Hình 2 là một khóa học mở đầu không chỉ dạy bạn SQL, mà còn dạy các khái niệm cơ bản về các hệ thống quản lý cơ sở dữ liệu quan hệ và các hệ thống khác. Hãy chọn khóa học này và đọc cuốn sách Những điều cơ bản về cơ sở dữ liệu - Database Fundamentals để thu được kinh nghiệm học tập tốt nhất.

Các khóa học ở bên trái của Hình 2 cung cấp cho bạn một nền tảng vững chắc về các khái niệm DB2 cốt lõi. Hãy chọn các khóa học "Đào tạo cần thiết về DB2 I - DB2 essential training I" và " Đào tạo cần thiết về DB2 II - DB2 essential training II" và đọc cuốn sách Bắt đầu với DB2 Express-C - Getting started with DB2 Express-C để có được các kết quả tối ưu.

Khóa học sắp được công bố "Có gì mới trong DB2 10 - What's new in DB2 10" giải thích các tính năng mới có sẵn với bản phát hành mới nhất của DB2 cho Linux, UNIX và Windows. Nó sẽ có các đoạn video với các trình diễn về các tính năng như là truy vấn theo hành trình thời gian, lưu trữ nhiều nhiệt độ, tính tương thích của Oracle và nhiều hơn nữa.

Ở giữa Hình 2 có liệt kê một khóa học: "Đào tạo cần thiết về Data Studio I - Data Studio Essential Training I". Tại thời điểm viết bài này, khóa học này đã được cập nhật lên phiên bản mới nhất của Data Studio; tuy nhiên, bạn có thể xem lại các đoạn video để hiểu rõ Data Studio, mặc dù các đoạn video này đã được tạo cho một phiên bản sản phẩm trước đó.

Cuối cùng, ở bên phải của Hình 2, có liệt kê khóa học "Đào tạo học thuật của DB2 - chuẩn bị kỳ thi 302A - DB2 academic training - 302A exam preparation". Khóa học này chuẩn bị cho bạn về Kỳ thi 302A của IBM, được phát triển cho cộng đồng học thuật. Nó bao gồm 13 bài học và một bài kiểm tra ví dụ mẫu sẽ cung cấp cho bạn một chỉ dẫn tốt về cách bạn sẽ làm trong kỳ thi thật.

Các khóa học về các chủ đề khác

Hình 3 cho thấy danh sách của các khóa học theo thể loại khác.

Hình 3. Các khóa học của Big Data University - Thể loại khác
được mô tả dưới đây

Khóa học "Tạo một khóa học trong Big Data University - Creating a course in Big Data University" cung cấp tất cả các hướng dẫn cần thiết cho bất cứ ai quan tâm đến việc phát triển một khóa học để công bố trên Big Data University. Chúng tôi khuyến khích bạn xem xét khóa học này và tìm cách dễ dàng để dễ tạo khóa học riêng của bạn. Mặc dù tất cả các khóa học tại Big Data University cho đến nay đều miễn phí, nếu bạn muốn phát triển một khóa học yêu cầu trả phí, Big Data University có khả năng hỗ trợ khóa học này.

Cuối cùng, khóa học "Phát triển nguồn mở - Open source development" (đang là bản beta) gồm có một danh sách các nhiệm vụ nguồn mở cần được thực hiện để hỗ trợ các tính năng Big Data University. Các thành viên của cộng đồng sẵn sàng giúp đỡ phát triển các tính năng này khi sử dụng PHP được miễn phí để liên hệ với chúng tôi và chúng tôi có thể cấp quyền truy cập vào khóa học này để xem xét các dự án hoặc nhiệm vụ cần được hoàn thành.


Tóm tắt

Bài này đã nói về các khóa học khác nhau có sẵn tại Big Data University mà bạn có thể chọn để nâng cao kỹ năng của mình về các công nghệ dữ liệu lớn, cũng như các công nghệ cơ sở dữ liệu. Các hình vẽ được trình bày trong bài này cung cấp một hướng học tập theo đề xuất hoặc thứ tự mà bạn nên làm theo. Tất cả các khóa học tại Big Data University hiện đang miễn phí, có bài tập của phòng thí nghiệm thực hành và cho phép bạn in chứng chỉ hoàn thành sau khi vượt qua một bài kiểm tra.

Big Data University là một trang web cộng đồng được IBM tài trợ. Chúng tôi mời các thành viên cộng đồng phát triển các khóa học mới và khóa học "Tạo một khóa học tại Big Data University" có tất cả các hướng dẫn để bắt đầu.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

  • Tải phiên bản dùng thử miễn phí của DB2 cho Linux, UNIX và Windows.
  • Bây giờ bạn có thể sử dụng DB2 miễn phí. Hãy tải về DB2 Express-C, một phiên bản DB2 Express Edition cho cộng đồng miễn phí cung cấp các tính năng dữ liệu cốt lõi giống như DB2 Express Edition và cung cấp một cơ sở vững chắc để xây dựng và triển khai các ứng dụng.
  • Tải về IBM Data Studio, có sẵn miễn phí. Data Studio cung cấp một môi trường mô đun, tích hợp để quản lý cơ sở dữ liệu sản xuất và cũng gồm có các công cụ phát triển cơ sở dữ liệu hợp tác cho DB2, Informix, Oracle và Sybase.

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạn



Lần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Information Management
ArticleID=832426
ArticleTitle=Bắt đầu khóa học của bạn về dữ liệu lớn
publish-date=09202012