تخط وانتقل إلى المحتوى الرئيسي

كيفية استخدام تقييم الوكيل الآلي من Astra لنشر وكلاء الذكاء الاصطناعي الموثوقين

تم إجراء التحديث أمس

ملخص

عندما تقوم بإنشاء وكيل AI في Astra، فإن النظام لا يقوم بإنشائه وتركه لك لتكتشف الباقي. بل يقوم بإنشاء حالات اختبار تلقائيًا لمساعدتك في تقييم وكيلك وتحسينه منذ البداية.

توضح هذه المقالة كيف يعمل الاختبار الآلي وتحسين المطالبات ولوحة معلومات التقييم معًا لمساعدتك في إطلاق وكيل موثوق وعالي الأداء بأقل جهد يدوي.

تعليمات

كيف يعمل التقييم الآلي للوكيل

بمجرد إنشاء وكيلك، تقوم Astra تلقائيًا بإنشاء حالات اختبار. هذا يلغي الحاجة إلى إعداد الاختبار اليدوي ويقلل من الوقت الذي يقضيه في التجربة والخطأ.

عندما تفتح صفحة Evaluation، سترى مجموعة من حالات الاختبار التي تم إنشاؤها تلقائيًا من تعليمات وكيلك الحالية.

تضع حالات الاختبار هذه خط أساس للأداء. فهي تساعدك على فهم كيفية استجابة وكيلك لأنواع المحادثات المختلفة والحالات الشاذة وسيناريوهات المخاطر. تتراوح هذه السيناريوهات من الاستعلامات القياسية إلى المشكلات المعقدة.

كيفية تشغيل التقييم وعرض النتائج

يمكنك تحديد حالات اختبار محددة من القائمة لتشغيل التقييم، أو النقر فوق Run all لتقييم جميع حالات الاختبار المتاحة في وقت واحد.

بمجرد اكتمال التقييم، سيعرض لك النظام أداء الوكيل في الوقت الفعلي. هذا يساعدك على تحديد التعليمات غير الواضحة أو غير المكتملة أو المتضاربة بسرعة.

سترى overall evaluation results، بما في ذلك:

  • Efficiency score - مدى جودة تعامل وكيل الذكاء الاصطناعي مع الأسئلة.

  • Accuracy - مدى صحة ردود وكيل الذكاء الاصطناعي.

  • Latency - مدى سرعة استجابة وكيل الذكاء الاصطناعي.

يمكنك أيضًا عرض التفاصيل التالية في evaluation summary:

  • Question - سؤال الاختبار المستخدم لتقييم وكيل الذكاء الاصطناعي.

  • Category - نوع السؤال، مثل standard query أو implied problem أو off-topic question.

  • Expected answer - الاستجابة التي من المتوقع أن يقدمها وكيل الذكاء الاصطناعي.

  • AI response - الاستجابة الفعلية التي تم إنشاؤها بواسطة وكيل الذكاء الاصطناعي.

  • Metrics - يعرض efficiency score للاستجابة.

  • Status - يشير إلى ما إذا كان وكيل الذكاء الاصطناعي passed or failed التقييم.

  • Notes - يعرض معلومات إضافية حول حالة الاختبار، مثل ما إذا كان السؤال auto-generated أو uploaded via CSV أو added manually.

يمكنك النقر فوق أي حالة اختبار فردية لعرض النتائج التفصيلية، بما في ذلك:

  • Evaluation Summary - تفصيل لكيفية استجابة الوكيل وسبب نجاحه أو فشله.

  • Expected Behaviour - الاستجابة الصحيحة أو المثالية التي كان يجب أن يقدمها الوكيل.

تتضمن كل نتيجة شرحًا تفصيليًا لكيفية تفسير الوكيل لإدخال المستخدم وما إذا كان قد استجاب بشكل صحيح. هذا يجعل من السهل تحديد الثغرات وتحسين تعليماتك بدقة.

ما عليك القيام به:

  • راجع نتائج كل حالة اختبار.

  • قارن استجابة الوكيل بملخص التقييم.

  • تحقق مما إذا كانت الاستجابة تتطابق مع السلوك المتوقع.

كيفية عرض تحليل وتوصيات AI

انقر فوق Analyse results لمراجعة نتيجة التقييم. قد يستغرق النظام بضع لحظات لمعالجة التحليل.

بعد اكتمال التحليل، انقر فوق View recommendation لعرض AI-powered optimization suggestions.

يلخص النظام المشكلات الرئيسية ويقدم توصيات عملية لتحسين دقة الوكيل وموثوقيته.

راجع high-priority suggestions بعناية. قد تتضمن هذه إضافة قواعد واضحة لطلبات معينة أو تحديد تعليمات خطوة بخطوة للمهام المعقدة مثل تتبع الطلبات.

كيفية تحديث تعليمات الوكيل

بعد مراجعة الاقتراحات، انقر فوق Update instructions لتطبيق التحسينات تلقائيًا. تساعد هذه الميزة على تبسيط عملية تحسين الوكيل باستخدام رؤى من الاختبار والتحليل في العالم الحقيقي. سيستغرق الأمر بضع لحظات ويعرض النتائج.

مراجعة وتطبيق التغييرات

ستعرض شاشة Review updated instructions التغييرات المقترحة. هنا، يمكنك أن ترى كيف تتم إضافة القواعد والإرشادات الجديدة إلى تعليمات الوكيل الحالية.

بعد التحسين:

  • تسلط البوابة الضوء على التحديثات المقترحة.

  • يمكنك أن ترى بوضوح ما تم تعديله وسبب ذلك.

  • راجع التحسينات المقترحة بعناية.

قم بالتمرير خلال التعليمات المحدثة للتأكد من أنها تلبي متطلباتك.

تأكد من أن اقتراحات AI تتماشى مع brand voice و business processes.

انقر فوق Accept لإنهاء التحديث.

تشغيل التقييم مرة أخرى

بعد حفظ التغييرات، انقر فوق Run all مرة أخرى لإعادة تقييم الوكيل باستخدام حالات الاختبار نفسها. سيقوم النظام بتشغيل التقييم بالتعليمات المحدثة. عند اكتمال الاختبار، يجب أن ترى أن جميع السيناريوهات قد اجتازت.

توضح هذه العملية كيف تساعدك analysis and recommendation features على تحسين أداء وكيل AI وتحسينه بشكل متكرر.

هل أجاب هذا عن سؤالك؟