يسعدنا الإعلان عن شراكة جديدة بين IBM وشركة Unstructured، وهي إحدى شركات محفظة IBM Ventures. نعمل معًا على معالجة أحد أبرز العوائق أمام توسيع نطاق الذكاء الاصطناعي في المؤسسات: إعداد البيانات غير المنظمة للاستخدام في الذكاء الاصطناعي التوليدي.
حوالي 80% من بيانات المؤسسة غير منظمة -وتوجد في ملفات PDF ورسائل البريد الإلكتروني ومنصات التعاون ومستودعات المستندات. ومع ذلك، فإن أقل من 1% من هذه البيانات موجودة في صيغة مناسبة مباشرةً لاستهلاك الذكاء الاصطناعي. تمثِّل هذه الفجوة فرصة هائلة وتحديًا حيويًا للمؤسسات التي توسِّع نطاق مبادرات الذكاء الاصطناعي.
الأساليب التقليدية لإعداد البيانات غير المنظمة تعيق المؤسسات. تتطلب مسارات البيانات اليدوية من 6 أشهر إلى 12 شهرًا للبناء وتظل هشة، حيث تتعرض للتوقف مع كل تغيير في تنسيق المستندات أو نظام المصدر. تقضي الفِرَق الهندسية وقتًا ثمينًا في تجميع البيانات بدلًا من الابتكار في مجال الذكاء الاصطناعي. ودون الهيكل والاتساق المناسبين، تقدِّم نماذج الذكاء الاصطناعي نتائج غير موثوق بها، ما يؤدي إلى تقويض الثقة وتأخير الوقت المناسب لتحقيق القيمة.
تعالج IBM watsonx.data هذا التحدي باعتبارها بحيرة بيانات هجينة ومفتوحة فريدة من نوعها في الصناعة، ومصممة خصيصًا للذكاء الاصطناعي والتحليلات. يعمل على تبسيط الوصول إلى البيانات المنظمة وغير المنظمة وإعدادها وحوكمتها، ما يساعد المؤسسات على إنشاء أساس بيانات موثوق به للذكاء الاصطناعي التوليدي على نطاق واسع.
من خلال هذه الشراكة، توسِّع Unstructured قدرة watsonx.data على الوصول إلى البيانات غير المنظمة وتحويلها إلى تنسيقات جاهزة للذكاء الاصطناعي التوليدي، لدعم حلول موثوق بها وقابلة للتوسع.
توفِّر Unstructured أكثر من 30 موصِّلًا جاهزًا لمصادر بيانات المؤسسات، بما في ذلك SharePoint وGoogle Drive وSalesforce وConfluence وBox وDropbox. مع دعم أكثر من 70 نوعًا من الملفات -من ملفات PDF ذات التنسيقات المعقدة إلى الصور الممسوحة ضوئيًا والبريد الإلكتروني ومستندات Microsoft Office- يمكن للمؤسسات الوصول إلى بياناتها بأكملها وتحويلها.
على عكس أدوات استخراج النصوص الأساسية، يحافظ فهم المستندات الذكي من Unstructured على العناصر الحيوية مثل الجداول والتسلسلات الهرمية والبنية الدلالية، ما يضمن أن تتلقى نماذج الذكاء الاصطناعي بيانات غنية بالسياق وليس مجرد نص غير منسَّق.
أداة بناء سير عمل مرئي دون برمجة تمكِّن فِرَق الأعمال والبيانات من تصميم وإدارة مسارات البيانات دون الحاجة إلى موارد هندسية متخصصة. بالنسبة للمؤسسات التي تمتلك فِرَق تطوير، توفِّر واجهة برمجة التطبيقات الشاملة تحكمًا برمجيًا وخيارات تخصيص متعددة.
تعمل عمليات المزامنة التلقائية بشكل تدريجي على إدخال المستندات الجديدة والمعدَّلة فقط، ما يؤدي إلى تقليل تكاليف المعالجة ويضمن بقاء تطبيقات الذكاء الاصطناعي محدَّثة. يساعد التنسيق متعدد المصادر على تنسيق تدفقات البيانات عبر أنظمة متعددة في الوقت نفسه، ما يُلغي عبء التنسيق اليدوي.
تُعَد Unstructured متوافقة مع معايير SOC 2 Type II وHIPAA وGDPR، بما يلبّي متطلبات الأمان والخصوصية الصارمة التي تحتاجها مؤسسات تكنولوجيا المعلومات. بالتعاون مع watsonx.data، يقدِّم الحل إمكانية التحكم في الإصدارات وتتبُّع مصدر البيانات ووضع ضوابط وصول دقيقة تحترم أذونات النظام المصدر طوال مسار البيانات.
تعمل Unstructured على تقديم بيانات غنية من الناحية الدلالية ومقسَّمة بطريقة مناسبة ومهيأة للعمل بكفاءة مع البنى الحديثة للذكاء الاصطناعي.
مع watsonx.data وUnstructured، يمكن للفِرَق التحرك بسرعة من خلال مسارات جاهزة للإنتاج تجمع بين السرعة والمرونة والجاهزية للذكاء الاصطناعي في حل متكامل واحد.
إذا كان watsonx.data هو محرك البيانات الذي يدعم تطبيقات الذكاء الاصطناعي التوليدي، فإن Unstructured هي الوقود الذي يغذيه. توفِّر كلٌّ من watsonx.data وUnstructured معًا بيانات غير منظمة جاهزة للذكاء الاصطناعي وتُتيح أنماطًا متقدمة للتوليد المعزز بالاسترجاع تعمل على تحسين دقة الذكاء الاصطناعي وموثوقيته.
يمكن للمؤسسات تسريع الوقت المناسب لتحقيق القيمة من خلال استبدال إعداد المستندات يدويًا بمعالجة مؤتمتة وذكية. تنتقل سياسات الحوكمة من أنظمة مصادر المستندات وصولًا إلى تطبيقات الذكاء الاصطناعي، ما يعزز الثقة والشفافية في كل مرحلة. من خلال إزالة عقبة إعداد البيانات غير المنظمة، وتوفير أساس بيانات يُتيح الوصول الموحَّد إلى البيانات وإعدادها وإدارتها، يمكن للمؤسسات أخيرًا الاستفادة من الإمكانات الكاملة لمحتواها غير المنظم لتشغيل ذكاء اصطناعي موثوق به وعالي المستوى يلائم المؤسسات.
لمشاهدة watsonx.data وUnstructured أثناء العمل، انضم إلى ندوة الإنترنت المشتركة القادمة أو احجز اجتماعًا. معًا، سنساعدك على الانتقال من قضاء الوقت في إعداد البيانات الفوضوية وغير المنظمة إلى تسريع وكالات وتطبيقات الذكاء الاصطناعي على مستوى المؤسسات، مدعومة ببيانات جاهزة للذكاء الاصطناعي وعلى نطاق واسع.