Dự báo tương lai, Phần 1: Phân tích dự báo là gì?

Bạn có thể sử dụng phân tích dự báo để giải quyết hầu hết các vấn đề gay cấn của mình. Nó giúp bạn phát hiện ra các mẫu trong quá khứ, mà có thể báo hiệu những gì ở tương lai. Bài đầu tiên của loạt bài bốn phần này tập trung vào phân tích dự báo. Nó bắt đầu bằng cách xem xét phân tích nói chung và sau đó đặt phân tích dựa vào dữ liệu tương phản với kiến thức chuyên gia và các quy tắc kinh doanh. Cả hai kiểu kiến thức đều có thể nâng cao khả năng ra quyết định của bạn. Phân tích dự báo có thể khám phá ra các mẫu ẩn giấu trong dữ liệu mà các chuyên gia con người có thể không thấy nó. Trong thực tế, đó là kết quả của toán học được áp dụng cho dữ liệu. Như vậy, nó được hưởng lợi từ các kỹ thuật toán học thông minh hơn cũng như từ dữ liệu tốt. Dựa vào đó, chúng ta có thể áp dụng phân tích dự báo cho vô số các tập dữ liệu trong các ngành công nghiệp phần mềm và các ngành dọc khác nhau, bài này giúp bạn tự mình xác định một vài ứng dụng phân tích dự báo.

Alex Guazzelli, Phó chủ tịch Analytics, Zementis, Inc.

Photo of Alex GuazzelliTiến sĩ Alex Guazzelli là Phó chủ tịch của Analytics tại Zementis. Inc, nơi ông chịu trách nhiệm về phát triển công nghệ lõi và các giải pháp dự báo theo ADAPA, một nền tảng ra quyết định dựa vào PMML (Predictive Model Markup Language - Ngôn ngữ đánh dấu mô hình dự báo). Tiến sĩ Guazzelli có bằng tiến sĩ Khoa học Máy tính của trường Đại học Nam California và gần đây đã là đồng tác giả cuốn sách " PMML trong hành động: Giải phóng Sức mạnh của các tiêu chuẩn mở cho khai phá dữ liệu và phân tích dự báo". Bạn có thể dõi theo ông tại @DrAlexGuazzelli.23 08 2012

Giới thiệu về loạt bài này

Đây là Phần 1 của một loạt bài bốn phần về phân tích dự báo. Phần 1 đưa ra một tổng quan chung về phân tích dự báo. Phần 2 sẽ tập trung vào các kỹ thuật mô hình hóa dự báo, đó là những thuật toán toán học tạo nên cốt lõi của phân tích dự báo. Sau đó phần 3 sẽ đưa những kỹ thuật này ra sử dụng và mô tả việc tạo một giải pháp dự báo. Cuối cùng, Phần 4 sẽ tập trung vào việc triển khai phân tích dự báo, đó là, quá trình đưa các giải pháp dự báo vào thực hiện.


Giới thiệu về phân tích

Hiện nay chúng ta đang sống với một biển dữ liệu luôn mở rộng. Để tìm đường đi lại một cách an toàn, chúng ta sử dụng phân tích. Nếu không có phân tích, đơn giản là chúng ta sẽ chìm nghỉm, thực sự không biết những gì đã xảy ra hoặc những gì sẽ xảy ra tiếp theo. Trong bài này, chúng ta tập trung vào kiến thức thu được từ phân tích, mà chúng ta có thể phân loại là phân tích mô tả hoặc là phân tích dự báo. Trong khi phân tích mô tả cho chúng ta biết những gì đã xảy ra trong quá khứ, thì phân tích dự báo lại tập trung vào những gì sẽ xảy ra tiếp theo.

Nhu cầu hiểu biết các sự kiện trong quá khứ của chúng ta đã dẫn đến một môn học mà chúng ta gọi là kinh doanh thông minh (business intelligence). Nó cho phép chúng ta đưa ra các quyết định dựa vào số liệu thống kê thu được từ dữ liệu lịch sử. Ví dụ:

  1. Có bao nhiêu khách hàng đã dao động hay rời bỏ đi, gây ra mất dần khách hàng trong sáu tuần qua?
  2. Có bao nhiêu tiền đã bị mất do gian lận trong ba tháng qua?
  3. Các thẻ hỗ trợ được tạo ra bao lâu một lần?
  4. Các khách hàng cư trú ở đâu (có thể được hiển thị bằng cách sử dụng các bản đồ của Google)?

Phân tích mô tả đi một chặng đường dài trong việc cho phép ra quyết định kinh doanh đúng đắn dựa trên những sự kiện, chứ không dựa trên cảm xúc. Tuy nhiên, đơn giản là phân tích mô tả chưa đủ. Trong xã hội mà chúng ta đang sống hiện nay, điều bắt buộc là các quyết định phải chính xác cao và phải lặp lại được. Vì lý do này, các công ty đang sử dụng phân tích dự báo đúng là để bàn đến tương lai và với cách làm như vậy, sẽ xác định được các quyết định kinh doanh và quy trình kinh doanh đúng đắn.

Là một môn học, Phân tích dự báo đã đã tồn tại nhiều thập kỷ. Là một chủ đề nóng trong giới học thuật trong nhiều năm qua, sự liên quan của nó trong ngành công nghiệp phần mềm đã tăng lên cùng với lượng dữ liệu đang được thu thập từ mọi người (ví dụ, từ các giao dịch trực tuyến và các mạng xã hội) và các cảm biến (ví dụ, từ các thiết bị di động dùng Hệ thống định vị toàn cầu - GPS) cũng như sự sẵn có của sức mạnh xử lý hiệu quả về chi phí, dù là dựa trên Cloud hay dựa trên Hadoop.


Kiến thức dựa vào dữ liệu so với kiến thức chuyên gia

Thật hào hứng khi nghĩ về kiến thức và cách chúng ta chuyển giao và sử dụng nó như thế nào. Theo truyền thống, chúng ta đã hy vọng ở các chuyên gia lĩnh vực để giúp chúng ta nhận được nhiều nhất trong một quy trình cụ thể. Kiến thức chuyên gia dựa trên kinh nghiệm và được tất cả các công ty sử dụng hàng ngày để chi phối các hoạt động hàng ngày. Dựa vào cách chúng ta có thể dịch các kiến thức chuyên gia thành một tập hợp các quy tắc kinh doanh, chúng ta đã xây dựng được các hệ thống dựa trên quyết định để tự động áp dụng kiến thức được các chuyên gia con người khám phá ra. IBM ILOG là một ví dụ hàng đầu về một hệ thống dùng để dịch kiến thức chuyên gia thành một tập hợp các câu lệnh IF-THEN mà chúng ta có thể đưa vào để làm việc ngay lập tức.

Mặt khác, kiến thức dựa vào dữ liệu, như tên của nó cho thấy, được dựa trên dữ liệu — thông thường, có rất nhiều. Một vài thập kỷ trước đây, một loạt các kỹ thuật thống kê đã nổi lên với mục đích phát hiện các mẫu dữ liệu thường mắt người không nhìn thấy được. Dựa vào đó chúng ta thu thập dữ liệu với khối lượng luôn tăng thêm hiện nay, những kỹ thuật như vậy đang tỏ ra là không thể thiếu được để trích ra giá trị từ dữ liệu, làm cho các quá trình có thể lặp lại và chính xác.

Bộ phim Moneyball là một ví dụ điển hình, thực sự tốt. Trong phim, một nhóm các đại lý tuyển dụng có kinh nghiệm đưa ra kiến thức và các linh cảm trực tiếp của họ về cần theo đuổi những người chơi nào cần mời tham gia nhóm. Điều đó là trái ngược với cách tiếp cận dựa vào dữ liệu, trong đó kiến thức được trích ra từ dữ liệu đã có sẵn cho mỗi người chơi và từ đó lắp ghép thành một nhóm. Mặc dù Moneyball chọn một kiểu kiến thức khác, trong hầu hết các trường hợp, chúng ta nên và cần sử dụng kiến thức chuyên gia và kiến thức dựa vào dữ liệu cùng với nhau.

Phân tích có thể tạo ra số liệu thống kê, các dự báo và các điểm số hợp lý. Tuy nhiên, để quyết định chọn cần làm gì với tất cả kiến thức dựa vào dữ liệu còn tùy thuộc vào một hệ thống dựa trên các quy tắc. Ví dụ, chúng ta có thể sử dụng một loạt các quy tắc để đưa ra các quyết định kinh doanh phụ thuộc vào kết quả do một mô hình dự báo thu được. Ví dụ, nếu một mô hình tồn tại để dự báo nguy cơ dao động hoặc rời bỏ đi của khách hàng, chúng ta có thể đưa ra các quy tắc đã biết đúng chỗ để giảm thiểu sự dao động nhằm xác định các quyết định kinh doanh cụ thể theo các mức nguy cơ khác nhau. Vì vậy, nếu nguy cơ cao, chúng ta có thể cung cấp cho một khách hàng một sự giảm giá là 20% cho lần mua tiếp theo của họ, nhưng nếu nguy cơ rất cao, thay vào đó chúng ta có thể cung cấp một sự giảm giá là 50%.


Một mô hình dự báo là gì?

Một mô hình dự báo chỉ đơn giản là một hàm toán học có thể học cách ánh xạ giữa một tập của các biến dữ liệu đầu vào, thường được đóng gói trong một bản ghi và một biến đáp ứng hay biến đích.

Chúng ta nói quá trình học này là có giám sát bởi vì, trong quá trình huấn luyện, dữ liệu được trình bày theo một mô hình dự báo với các dữ liệu đầu vào và đầu ra hay kết quả mong muốn. Việc huấn luyện được lặp lại cho đến khi mô hình học được hàm ánh xạ giữa các đầu vào đã cho và đầu ra mong muốn. Các ví dụ về các mô hình dự báo đang sử dụng việc học tập có giám sát bao gồm các mạng thần kinh lan truyền-ngược, các máy véc tơ hỗ trợ và các cây quyết định. Một mô hình dự báo cũng có thể sử dụng việc học tập không giám sát. Trong trường hợp này, nó chỉ được trình bày với dữ liệu đầu vào. Sau đó, nhiệm vụ của nó là tìm ra các bản ghi dữ liệu đầu vào khác nhau liên quan với nhau như thế nào. Phân cụm (clustering) là kiểu mô hình dự báo được sử dụng phổ biến nhất, có sử dụng cách học tập không giám sát.

Vì vậy, để đưa ra một ví dụ, hãy tưởng tượng rằng bạn muốn tạo ra một mô hình dự báo sẽ có thể nói ai đó trong số khách hàng của bạn có thể bỏ đi (20 hoặc 50% giảm giá cho ai?). Trước tiên, bạn quay trở lại các dữ liệu lịch sử của mình trong lúc tìm kiếm các đặc tính mà bạn có thể sử dụng để xây dựng một mô hình làm như vậy. Bằng cách xem xét cơ sở dữ liệu của mình, bạn có thể sưu tập một danh sách các đặc tính liên quan đến sự mất dần khách hàng đối với cả khách hàng hiện tại và khách hàng trong quá khứ đã bỏ đi. Nó có thể bao gồm số lượng các khiếu nại trong 6 tháng qua, số lượng các thẻ hỗ trợ đã mở trong 4 tuần qua, khách hàng có thường hay mua hàng không và đã tiêu bao nhiêu tiền để mua hàng hóa hoặc các dịch vụ (trên mạng hoặc trong cửa hàng) và thông tin tổng quát như tuổi tác, giới tính và số liệu thống kê dân số. Hình 1 cho thấy hai khách hàng như vậy cùng với các đặc tính thu được cho mỗi người. Khách hàng (Customer) 1 là một khách hàng hiện tại và dường như được thỏa mãn. Tuy nhiên, Khách hàng 2, đã bỏ đi.

Hình 1. Hai khách hàng và các đặc tính đầu vào của họ.
Ví dụ về hai khách hàng và các đặc tính đầu vào của họ. Khách hàng (Customer) 1 là một khách hàng hiện tại, Khách hàng 2 đã bỏ đi

Trong một kiểu kịch bản học tập có có giám sát, như thể hiện trong Hình 2 bạn cung cấp tất cả dữ liệu khách hàng của mình cho một kỹ thuật dự báo trong quá trình huấn luyện. Trong trường hợp này, đầu vào gồm có tất cả các đặc tính mà bạn đã có được (liên quan đến sự hài lòng, nhân khẩu học và v.v..) cho mỗi khách hàng cũng như kết quả liên quan. Kết quả này nói cho mô hình dự báo biết có hay không có bản ghi dữ liệu đại diện cho một khách hàng, người đã bỏ đi hoặc đã không bỏ đi. Lý do ở đây là mô hình có thể học các sự khác biệt, hay các mẫu, giữa hai nhóm: khách hàng hài lòng hiện có và khách hàng đã bỏ đi.

Hình 2. Dữ liệu khách hàng gồm các đặc tính đầu vào và kết quả đầu ra được cung cấp cho một mô hình dự báo trong quá trình huấn luyện
So sánh dữ liệu khách hàng của các đặc tính đầu vào và kế quả được cung cấp cho mo hình dự báo trong lúc huấn luyện

Sau khi chúng ta xây dựng một mô hình dự báo, chúng ta cần phải xác nhận tính hợp lệ cho nó. Xác nhận hợp lệ là cố gắng trả lời câu hỏi ở hai mức: "Nó có làm việc không?" và nếu có, "Nó chính xác đến mức nào?". Nếu câu trả lời cho câu hỏi đầu tiên rõ ràng là có (yes) và câu trả lời cho câu hỏi thứ hai là chính xác cao, thì bạn biết mô hình của mình làm việc được và nó có thể tổng quát hóa tốt. Mọi thứ mà bạn cần bây giờ là làm cho nó sẵn sàng thực hiện. Để làm điều này, nó cần được triển khai hoạt động. May mắn thay, hiện có một tiêu chuẩn tên là PMML (Ngôn ngữ đánh dấu mô hình dự báo) cho phép các mô hình dự báo dễ dàng di chuyển giữa các hệ thống khác nhau. Với PMML, chúng ta có thể sử dụng một ứng dụng như IBM SPSS Statistics để xây dựng và xác nhận hợp lệ một mô hình dự báo, rồi chúng ta có thể lưu trữ như là một tệp PMML. Như vậy, chúng ta có thể trực tiếp tải nó lên vào một công cụ tính điểm như công cụ ADAPA của Zementis, tại đây nó sẵn sàng để sử dụng trong thời gian thực. Để biết thêm thông tin về PMML và các công nghệ mô tả ở đây, xem phần Tài nguyên.

Sau khi triển khai, chúng ta có thể sử dụng mô hình khách hàng bỏ đi để theo dõi tất cả hoạt động của khách hàng hiện có. Một mô hình dự báo tốt có thể tổng quát hóa kiến thức của mình để tính toán nguy cơ bỏ đi ngay cả đối với các khách hàng mà mô hình dự báo chưa bao giờ gặp phải trước đó. Hình 3 cho thấy dữ liệu cho một khách hàng như thế, được xác định là khách hàng 3, đang được cung cấp cho mô hình khách hàng bỏ đi của chúng ta. Nếu mô hình này nhận thấy rằng một mẫu khách hàng bỏ đi đang nổi lên với một khách hàng cụ thể, nó sẽ làm tăng nguy cơ hay kết quả đầu ra của nó một cách phù hợp cho đến khi có một quyết định kinh doanh ở bộ phận của bạn để giải quyết nó. Khi mà khách hàng cụ thể đó lại trở nên hài lòng với các sản phẩm và các dịch vụ của bạn, nguy cơ này sẽ giảm bớt, do không còn thấy mẫu khách hàng bỏ đi nữa.

Hình 3. Khi đã triển khai hoạt động, mô hình khách hàng bỏ đi vừa mới tạo ra được sử dụng để tính điểm các khách hàng mới và hiện có để tính toán một điểm số cho nguy cơ bỏ đi của mỗi khách hàng. Nếu phát hiện ra một nguy cơ bỏ đi cao, có thể đưa ra các thủ tục đúng chỗ nhằm giảm thiểu nó.
Khi đã triển khai họat động, mô hình khách hàng bỏ đi mới được tạo ra được sử dụng để tính điểm các khách hàng mới và hiện có để tính toán một điểm số nguy cơ bỏ đi cho mỗi khách hàng. Nếu phát hiện ra một nguy cơ bỏ đi cao, có thể đưa ra các thủ tục đúng chỗ nhằm giảm thiểu nó

Tầm quan trọng của dữ liệu tốt

Xu hướng đầu tiên của tôi trong việc đặt tên cho phần này là gọi nó là "tầm quan trọng của dữ liệu" bởi vì không có dữ liệu, thì không có phân tích và cũng chẳng có phân tích dự báo. Trong suốt sự nghiệp của mình là một nhà khoa học khai phá dữ liệu, tôi đã thấy nhiều doanh nghiệp rất có chủ ý trong việc tìm kiếm một giải pháp phân tích dự báo cho công ty của họ. Mặc dù họ biết rằng phân tích dự báo có thể giúp cải thiện kết quả của họ, nhưng họ lại không có đủ dữ liệu. Đó là, không đủ dữ liệu cho một nhà khoa học dữ liệu để thực sự huấn luyện một mô hình có ý nghĩa. Trong kỷ nguyên của Dữ liệu lớn (Big Data), điều đó thực sự hay xảy ra đến mức có thể làm cho bạn ngạc nhiên. Đối với một số mô hình dự báo để có thể học và tổng quát hóa, phải cần đến hàng ngàn bản ghi và nhiều hơn thế. Với ví dụ của chúng ta ở trên, chừng một trăm hồ sơ chứa dữ liệu khách hàng đã bỏ đi trong quá khứ có thể là không đủ. Nếu không sử dụng đủ dữ cho việc huấn luyện, một mô hình có thể không có khả năng học hoặc tệ hơn, nó có thể quá khớp. Điều đó có nghĩa là nó học tất cả mọi thứ về dữ liệu đã đưa ra trong quá trình huấn luyện, nhưng nó không có khả năng tổng quát hóa kiến thức đó khi nhận được dữ liệu mới. Đơn giản là nó không thể dự báo được.

Nếu có sẵn đủ dữ liệu, thì tiếp theo là câu hỏi dữ liệu tốt đến mức nào. Đó là vì, chất lượng của dữ liệu sẽ trực tiếp phản ánh vào chất lượng của mô hình này. Không hề phóng đại: chất lượng đầu ra là một hàm của chất lượng đầu vào!

Nhiều năm trước, nhóm của tôi và tôi đã được giao nhiệm vụ xây dựng một mô hình để dự báo xem một quy trình sản xuất nào đó sẽ dẫn đến thành công hay thất bại. Quá trình sản xuất này mất khoảng tám giờ để hoàn thành và tiêu thụ nhiều tài nguyên. Chỉ sau khi đã hoàn thành, các kỹ sư đảm bảo chất lượng của công ty mới có thể xác định xem có điều gì không ổn diễn ra trong quá trình sản xuất không. Nếu có, toàn bộ lô sản phẩm này phải bị loại bỏ và một lô mới được bắt đầu lại từ đầu. Ý tưởng ở đây là chúng ta có thể xem xét dữ liệu thu được trong quá khứ cho tất cả các giai đoạn của quy trình này đối với các lô đã kết cục là tốt hoặc xấu. Sau đó, chúng ta có thể huấn luyện một mô hình để phát hiện ngay khi mọi thứ bắt đầu có vẻ xấu đi từ rất sớm trong quy trình này. Một điều thú thật là, chúng tôi thực tế chưa xây dựng bất cứ mô hình nào. Trong quá trình phân tích dữ liệu, chúng tôi đã phát hiện ra rằng dữ liệu đã bị hỏng hoặc tệ hơn, bị bỏ sót trong một số giai đoạn sản xuất then chốt. Quan trọng hơn, chúng tôi không thể tìm ra kết quả đầu ra hay là các thông tin sẽ cho phép chúng tôi phân biệt các lô tốt với các lô xấu. Điều đó có nghĩa là chúng tôi sẽ không thể sử dụng một kỹ thuật học có giám sát. Và, việc thiếu các phần quan trọng của dữ liệu đầu vào đã là hiểm họa đối với việc sử dụng một kỹ thuật học không giám sát.

Dữ liệu tự nó không trở thành giá trị dự báo. Nhưng dữ liệu tốt thì có.


Các ứng dụng về phân tích dự báo

Khi học về phân tích dự báo lần đầu, tôi đã nhận được một cuốn sách của Duda, Hart và Stock có nhan đề Phân loại mẫu (xem phần Tài nguyên). Cuốn sách này hiện nay được coi là một tài liệu tham khảo kinh điển trong lĩnh vực này. Trong đó, các tác giả xây dựng một hệ thống phân loại mẫu cho một nhà máy chế biến cá. Trong nhà máy này, họ sử dụng một giải pháp dự báo để phân loại cá đưa vào thành cá hồi hay là cá vược biển phụ thuộc vào các đặc tính đầu vào như chiều dài và mật độ của vảy cá. Năm 2010, tôi đã trình bày tại Hội nghị Ngày hội các quy tắc (Rules Fest Conference) tại San Jose về phân tích dự báo. Trong bài trình bày, có tên là "Làm theo các quy tắc của bạn, nhưng hãy lắng nghe dữ liệu của bạn" (xem phần Tài nguyên), tôi đã sử dụng chính ví dụ đó để trình bày cho người nghe được thăm dò ý kiến về các quy tắc thấy được, không chỉ cách chúng ta có thể giải quyết một vấn đề như vấn đề này bằng cách sử dụng phân tích dự báo, mà còn thấy được cách phân tích dự báo có thể kết hợp với các quy tắc kinh doanh để cải thiện việc ra quyết định. Ý tưởng này rõ ràng là sử dụng ví dụ theo cách giống như Duda, Hart và Stock. Đó là, như một ví dụ tổng quát về cách xây dựng và áp dụng một giải pháp dự báo và để người nghe tổng quát hóa nó cho các ứng dụng khác. Trong bài này, thay vào đó tôi sử dụng sự bỏ đi của khách hàng. Bất luận thế nào, để bạn tổng quát hóa kiến thức mà mình đã thu thập cho đến nay để tạo các ứng dụng mới, tôi sẽ mô tả dưới đây nhiều cách, trong đó phân tích dự báo sẽ biến thế giới của chúng ta thành một thế giới thông minh hơn.

Một ứng dụng về phân tích dự báo vốn đã rất thành công trong nhiều năm nay là phát hiện gian lận. Mỗi khi bạn quẹt thẻ tín dụng của mình hoặc sử dụng nó trên mạng, rất có thể là giao dịch của bạn đang được phân tích trong thời gian thực để biết khả năng gian lận ra sao. Tùy thuộc vào nguy cơ đã nhận biết được, hầu hết các tổ chức thực hiện một tập hợp các quy tắc nghiệp vụ thậm chí có thể từ chối một giao dịch có nguy cơ cao. Đây là đích cuối cùng của phân tích dự báo trong cuộc chiến chống tội phạm, đó là, ngăn không cho nó xảy ra ngay từ đầu.

Trong một bài báo đã viết trước đó cho developerWorks, tôi liệt kê một vài ứng dụng quan trọng của phân tích dự báo trong lĩnh vực y tế. Gian lận về Medicare hầu như chắc chắn đứng đầu danh sách này, nhưng việc sử dụng phân tích dự báo để thực hiện chăm sóc phòng ngừa có hiệu quả cũng như vậy. Nhờ biết được bệnh nhân nào có nguy cơ phát triển cao về một căn bệnh nào đó, chúng ta có thể áp dụng các biện pháp phòng ngừa để giảm thiểu nguy cơ và cuối cùng cứu sống người bệnh. Gần đây, phân tích dự báo đã là trung tâm chú ý của một cuộc tranh luận công khai, trong đó dữ liệu khiếu nại lịch sử được sử dụng để làm giảm số lượng bệnh nhân nhập viện lại (xem phần Tài nguyên).

Ngoài ra, các công ty sử dụng phân tích dự báo để giới thiệu các sản phẩm và các dịch vụ. Ngày nay, chúng ta đã quen với việc mong đợi các giới thiệu thích đáng cho phim ảnh, các cuốn sách và các bài hát từ các cửa hàng và thương nhân ưa thích nhất của chúng ta. Vì lẽ đó, chúng ta cũng đang trải qua các chiến dịch tiếp thị được điều chỉnh càng ngày càng hợp hơn với thị hiếu và các sở thích của chúng ta, ví dụ, dựa vào nội dung của các thư điện tử của chúng ta, dựa vào các bài đăng và tìm kiếm trên mạng.

Các ứng dụng khác tập trung vào các dữ liệu thu thập được từ các cảm biến. Ví dụ, chúng ta có thể sử dụng dữ liệu của thiết bị di động GPS để dự báo mật độ giao thông. Khi các hệ thống này ngày càng trở nên chính xác, chúng ta sẽ có thể sử dụng chúng để làm thay đổi các lựa chọn đi lại riêng của mình. Ví dụ, một hôm nào đó chúng ta có thể đi xe lửa nếu dự báo tuyến đường hoàn toàn bị tắc nghẽn với ô tô.

Hơn nữa, sự sẵn có của các cảm biến nhỏ và hiệu quả về chi phí, dùng để thông báo về tình trạng hiện tại của các cấu trúc như các cây cầu và các tòa nhà cũng như máy móc chẳng hạn như các trạm biến thế điện, các máy bơm nước và các máy bơm không khí, các cửa cống và các van, đã cho phép sử dụng phân tích dự báo để bảo trì hoặc tiến hành các thay đổi về vật liệu hoặc quy trình trước khi có hư hỏng và các tai nạn xảy ra. Bằng cách cho phép xây dựng các mô hình bảo trì dự báo, việc sử dụng dữ liệu từ các cảm biến là một cách rõ ràng hướng tới việc trợ giúp để đảm bảo an toàn. Thảm họa tràn dầu ở Vịnh Mexico trong năm 2010 và sự sụp đổ của cây cầu I-35W qua sông Mississippi vào năm 2007 chỉ là hai ví dụ về các tai nạn nghiêm trọng, có thể ngăn chặn được nếu các cảm biến và các mô hình bảo trì dự báo đã được áp dụng.


Kết luận

Trong một biển dữ liệu luôn mở rộng, được thu thập từ mọi người và các cảm biến, phân tích dự báo cung cấp các công cụ dẫn hướng cần thiết cho các công ty và các cá nhân để đạt tới đích của họ thành công. Nó làm điều đó bằng cách dự báo về những gì sẽ xảy ra, vì thế ta có thể đáp ứng thích hợp để tiếp tục tiến trình chính xác, an toàn, có thể lặp lại, có lợi nhuận và hiệu quả nhất.

Việc sử dụng phân tích dự báo đã đang cách mạng hóa cách chúng ta tương tác với môi trường của mình. Khi số lượng dữ liệu tăng lên và chất lượng được cải thiện, lại được trợ giúp bởi sự có sẵn của sức mạnh xử lý hiệu quả về chi phí, phân tích dự báo bắt buộc sẽ lan tỏa thậm chí còn hơn so với hiện nay. Nếu bạn đã xác định được một vài vấn đề mà bạn có kế hoạch để giải quyết với phân tích dự báo, bạn sẽ đồng ý rằng đây không phải là một dự báo khó thực hiện.

Tài nguyên

Học tập

Lấy sản phẩm và công nghệ

  • IBM SPSS Statistics 20 đặt sức mạnh của phân tích thống kê tiên tiến vào tay của bạn. Cho dù bạn là một người mới bắt đầu hay là nhà thống kê có kinh nghiệm, tập hợp đầy đủ các công cụ của nó sẽ đáp ứng các nhu cầu của bạn.
  • ADAPA là một nền tảng quản lý ra quyết định phân tích dự báo có tính cách mạng, có sẵn như một dịch vụ trên đám mây hoặc dịch vụ tại chỗ. Nó cung cấp một môi trường an toàn, nhanh chóng và có khả năng mở rộng để triển khai các mô hình khai phá dữ liệu và logic kinh doanh của bạn và đưa chúng vào sử dụng trong thực tế.
  • Hãy dùng thử bản dùng thử 90 ngày của Xưởng tối ưu hóa CPLEX ILOG của IBM: Nhanh chóng phát triển các ứng dụng hỗ trợ ra quyết định dựa trên sự tối ưu hóa.
  • Tìm thêm nhiều phần mềm đánh giá: Tải về một phiên bản dùng thử, làm việc với sản phẩm trong một môi trường sandbox trực tuyến hoặc truy cập nó trong đám mây.
  • Đánh giá IBM WebSphere Application Server: Xây dựng, triển khai và quản lý các dịch vụ và ứng dụng nghiệp vụ SOA mạnh, nhanh chóng và có thể dùng lại được trong khi giảm các chi phí cơ sở hạ tầng ứng dụng với Máy chủ ứng dụng WebSphere của IBM.

Thảo luận

Bình luận

developerWorks: Đăng nhập

Các trường được đánh dấu hoa thị là bắt buộc (*).


Bạn cần một ID của IBM?
Bạn quên định danh?


Bạn quên mật khẩu?
Đổi mật khẩu

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Ở lần bạn đăng nhập đầu tiên vào trang developerWorks, một hồ sơ cá nhân của bạn được tạo ra. Thông tin trong bản hồ sơ này (tên bạn, nước/vùng lãnh thổ, và tên cơ quan) sẽ được trưng ra cho mọi người và sẽ đi cùng các nội dung mà bạn đăng, trừ khi bạn chọn việc ẩn tên cơ quan của bạn. Bạn có thể cập nhật tài khoản trên trang IBM bất cứ khi nào.

Thông tin gửi đi được đảm bảo an toàn.

Chọn tên hiển thị của bạnLần đầu tiên bạn đăng nhập vào trang developerWorks, một bản trích ngang được tạo ra cho bạn, bạn cần phải chọn một tên để hiển thị. Tên hiển thị của bạn sẽ đi kèm theo các nội dung mà bạn đăng tải trên developerWorks.

Tên hiển thị cần có từ 3 đến 30 ký tự. Tên xuất hiện của bạn phải là duy nhất trên trang Cộng đồng developerWorks và vì lí do an ninh nó không phải là địa chỉ email của bạn.

Các trường được đánh dấu hoa thị là bắt buộc (*).

(Tên hiển thị cần có từ 3 đến 30 ký tự)

Bằng việc nhấn Gửi, bạn đã đồng ý với các điều khoản sử dụng developerWorks Điều khoản sử dụng.

 


Thông tin gửi đi được đảm bảo an toàn.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=70
Zone=Nguồn mở
ArticleID=831413
ArticleTitle=Dự báo tương lai, Phần 1: Phân tích dự báo là gì?
publish-date=08232012