Watson Discovery 特性

持續相關性訓練

進一步瞭解

讓 Discovery 經過一段時間後自動瞭解最相關的答案。從使用者互動中自動瞭解,省去人工訓練 Discovery 相關性的時間和精力。根據實際使用資料進行訓練,而不是針對更具代表性模型而以人工建構的訓練集。隨資料和使用情形變更而自動更新訓練,不需要手動建立新的訓練資料。

Watson Recommends

進一步瞭解

主動監視和改進 Discovery 應用程式的效能。這個新特性提供:對文件擷取之定量度量的透析,例如總查詢數和最熱門關鍵字及一段時間的度量趨勢,透過新增內容、定義同義字及執行其他訓練等方式來增進效能。

點按方式

進一步瞭解

全新架構啟用無程式碼連線功能。使用簡單的點按功能來選擇要在 Discovery 工具使用者介面中分析的資料來源。合併來自多個孤立來源的資料,包括目前的 Box、Sharepoint、Salesforce 以及未來 20 個以上的更多來源(包括資料庫、網站、內容管理系統)。

內嵌的 NLP

進一步瞭解

Watson Discovery 有附帶內建的自然語言處理程序。只要點選幾個選項,我們就能夠擷取觀感、實體、概念、語意角色等等。

相關性訓練

進一步瞭解

您可以訓練 Discovery 服務來改善您的語料庫查詢結果的相關性。當您向 Discovery 提供訓練資料時,該服務會使用機器學習的 Watson 技術來尋找內容和問題中的信號。然後,該服務會重新排序結果,把最相關的結果顯示在最上面。當您新增更多訓練資料時,該服務在其傳回的結果排序中會變得更加正確和精準。

領域自訂作業

進一步瞭解

可以教導 Discovery 瞭解您領域特有的術語。只需使用 Watson Knowledge Studio 建置的自訂機器學習模型,就可以自訂您語料庫的強化。

段落擷取

進一步瞭解

段落擷取提供此選項:將符合已定義為文字區塊的搜尋準則之特定段落傳回給使用者。

文件相似性

進一步瞭解

「文件相似性」可讓您提供已知的文件 ID - Discovery 會加以分析、瞭解文件最重要的層面,並在集合中尋找文字類似的文件。

異常偵測

進一步瞭解

異常偵測是用來尋找某時間序列內的不尋常資料點,並標示它們以供進一步檢閱。異常偵測的用法範例包括識別新聞警示、事件偵測及尋找趨勢。

Discovery News

進一步瞭解

Discovery News 包含在 Discovery 中,它是預先強化的新聞文章資料集,會持續更新。

Knowledge Graph(測試版)

進一步瞭解

Knowledge Graph 可以作為 貴公司的「知識中心」,並可用於企業搜尋、摘要、推薦引擎及其他決策製作程序。Knowledge Graph 可透過擷取及釐清實體和關係、利用演算法技術來強化關係,以及使用相關性演算法將結果排名,從非結構化資料中自動建立自訂的知識圖形。

元素分類

進一步瞭解

「元素分類」可讓您透過控管文件來快速剖析,以轉換、識別及分類重要元素。使用先進的「自然語言處理程序」,從文件的元素中擷取參與方(它所參照的)、本質(元素類型)和種類(特定類別)。

Document Deduplication(測試版)

進一步瞭解

如果您要查詢 Discovery News 集合,或您的私人資料集合包含多個相同的(或幾乎相同的)文件,您可以使用刪除重複功能,從查詢結果中排除它們。

Visual Insights(實驗功能)

進一步瞭解

Visual Insights 是一個實驗功能,讓您能夠以視覺化方式探索 Discovery 對於語意元素、關係、概念等等的瞭解所識別的關聯。您可以先進一步瞭解您的集合之後,再使用 Discovery 建立查詢,然後您可以將其整合到新的應用程式或現有的解決方案中,來引導使用者取得其需要的資訊。

文件分段

進一步瞭解

您可以根據 HTML 標題大小標籤,將 Word、PDF 及 HTML 文件分割成區段。分割之後,每個區段就是個別文件,將分開進行強化和檢索。由於查詢會將這些區段傳回為個別文件,因此可以使用文件分段來對文件的個別區段執行聚集,以及對區段(而非文件)執行相關性訓練,這將改進結果重新排名。

查詢擴展

進一步瞭解

您可以在完全相符之外擴展查詢範圍 - 例如,您可以擴展 "car" 的查詢,以包含 "automobile" 和 "motor vehicle" - 透過使用 Discovery API 來上傳查詢擴展術語之清單。查詢擴展術語通常是一般術語的同義字、反義字或典型拼錯。