المدوَّنة العربية

تبسيط رحلة تحويل البيانات إلى رؤى قابلة للتنفيذ مع إمكانات Amazon SageMaker Catalog الجديدة

تقوم المؤسسات الحديثة بإدارة بياناتها عبر أنظمة متعددة غير متصلة – مثل قواعد البيانات المنظمة والملفات غير المنظمة وأدوات التصور المنفصلة – مما يخلق عوائق تُبطئ عمليات التحليل وتحد من القدرة على استخلاص رؤى تدعم اتخاذ القرارات التجارية بفعالية.

يمنع هذا مؤسستك من تحقيق الاستفادة الكاملة من استثماراتها في البيانات، مما يؤدي إلى تأخير في اتخاذ القرارات وضياع فرص لإجراء تحليلات شاملة تدمج أنواع مختلفة من البيانات.

لتسريع رحلتك من البيانات الخام إلى الرؤى القابلة للتنفيذ، يمكنك استخدام ثلاث إمكانات جديدة في Amazon SageMaker:

  • التكامل مع Amazon QuickSight – يمكنك الآن تشغيل Amazon QuickSight مباشرة من Amazon SageMaker Unified Studio لإنشاء لوحات معلومات باستخدام بياناتك، ثم نشرها في Amazon SageMaker Catalog  لتسهيل اكتشافها ومشاركتها عبر مؤسستك.
  • دعم حاويات Amazon S3 للأغراض العامة و Amazon S3 Access Grants في SageMaker Catalog – مما يجعل من السهل على الفرق العثور على البيانات المخزنة في حاويات Amazon S3 العامة، والوصول إليها، والتعاون فيها بما في ذلك البيانات غير المنظمة، مع الحفاظ على تحكم دقيق في الوصول باستخدام Amazon S3 Access Grants.
  • الاستيراد التلقائي للبيانات من بنية Lakehouse  الاستيراد التلقائي لمجموعات البيانات الموجودة مسبقًا في AWS Glue Data Catalog (GDC) من بنية Lakehouse إلى SageMaker Catalog، دون الحاجة إلى إعداد يدوي.

تعالج إمكانات SageMaker الجديدة دورة حياة البيانات بالكامل ضمن تجربة موحدة ومحكومة. إذ تتيح الاستيراد التلقائي للبيانات المنظمة الموجودة مسبقًا من بنية lakehouse، والفهرسة السلسة لمحتوى البيانات غير المنظمة المخزنة في Amazon S3، وعرضًا مرئيًا مبسّطًا عبر QuickSight – وكل ذلك ضمن إطار حوكمة موحد وضوابط وصول متسقة.

لنلقِ نظرة أقرب على هذه الإمكانات.

تكامل Amazon SageMaker وAmazon QuickSight
مع هذا التكامل، يمكنك إنشاء لوحات معلومات في Amazon QuickSight باستخدام بيانات من مشاريعك في Amazon SageMaker. عند تشغيل QuickSight من خلال Amazon SageMaker Unified Studio، يقوم Amazon SageMaker تلقائيًا بإنشاء مجموعة بيانات QuickSight وتنظيمها داخل مجلد آمن لا يمكن الوصول إليه إلا لأعضاء المشروع فقط.

بالإضافة إلى ذلك، تبقى لوحات المعلومات التي تنشئها ضمن هذا المجلد وتظهر تلقائيًا كأصول في مشروعك في SageMaker، حيث يمكنك نشرها في SageMaker Catalog ومشاركتها مع مستخدمين أو مجموعات ضمن شركتك. ويساعد ذلك في الحفاظ على تنظيم لوحات معلوماتك منظمة وقابلة للاكتشاف والحوكمة داخل SageMaker Unified Studio.

لاستخدام هذا التكامل، يجب أن يكون كل من نطاق Amazon SageMaker Unified Studio وحساب QuickSight متكاملين مع AWS IAM Identity Center، ويستخدمان نفس الإعدادات. بالإضافة إلى ذلك، يجب أن يكون حساب QuickSight موجودًا ضمن نفس حساب AWS الذي ترغب في تفعيل مخطط QuickSight فيه. يمكنك معرفة المزيد حول المتطلبات المسبقة من خلال صفحة الوثائق.

بعد استيفاء هذه المتطلبات، يمكنك تفعيل مخطط Amazon QuickSight من خلال الانتقال إلى وحدة تحكم Amazon SageMaker واختيار Blueprints. ثم ابحث عن Amazon QuickSight واتبع التعليمات.

ستحتاج أيضًا إلى إعداد ملف تعريف مشروع SQL analytics ليتضمّن Amazon QuickSight في إعدادات Add blueprint deployment settings.

لمعرفة المزيد حول خطوات الإعداد، يُرجى الرجوع إلى صفحة الوثائق.

بعد ذلك، عند إنشاء مشروع جديد، ستحتاج إلى تحديد SQL analytics ضمن Project profiles.

بعد إنشاء مشروعك، يمكنك البدء في إنشاء تصورات باستخدام QuickSight. يمكنك الانتقال إلى Data، وتحديد الجدول (table) أو العرض (view) الذي ترغب في تصوّره، ثم اختيار Open in QuickSight من ضمن قائمة Actions.

سيتم توجيهك إلى صفحة transactions ضمن Datasets في Amazon QuickSight، حيث يمكنك اختيار USE IN ANALYSIS لبدء استكشاف البيانات.

عند إنشاء مشروع باستخدام مخطط QuickSight، يقوم SageMaker Unified Studio تلقائيًا بإنشاء مجلد QuickSight مقيّد لكل مشروع، حيث تُنظَّم جميع الأصول الجديدة — مثل التحليلات، ومجموعات البيانات، ولوحات المعلومات — ضمن هذا المجلد. ويحافظ هذا التكامل على مزامنة فورية لصلاحيات المجلد، لضمان توافق أذونات الوصول في QuickSight مع عضوية المشروع.

دعمً حاويات Amazon S3 للأغراض العامة
اعتبارًا من اليوم، يضيف SageMaker دعمًا لحاويات S3 للأغراض العامة في SageMaker Catalog، بهدف تعزيز إمكانية اكتشاف البيانات، مع تمكين صلاحيات دقيقة من خلال ميزة S3 Access Grants، مما يمنح المستخدمين القدرة على التحكم في البيانات، بما في ذلك مشاركتها وإدارة أذوناتها. يمكن الآن لمستهلكي البيانات مثل علماء البيانات، والمهندسين، ومحللي الأعمال اكتشاف أصول S3 والوصول إليها من خلال SageMaker Catalog. كما يتيح هذا التوسّع لمنتجي البيانات إدارة إعدادات الأمان لأي أصل بيانات في S3 من خلال واجهة واحدة.

لاستخدام هذا التكامل، يجب أن تملك الأذونات المناسبة لحاويات S3 للأغراض العامة، وأن تكون لمشاريعك في SageMaker Unified Studio صلاحية الوصول إلى تلك الحاويات التي تحتوي على بياناتك. يمكنك معرفة المزيد حول المتطلبات المسبقة من خلال صفحة الوثائق الخاصة ببيانات Amazon S3 في SageMaker Unified Studio.

ويمكنك أيضًا إضافة اتصال بحاوية S3 موجودة مسبقًا.

عند إتمام الاتصال، يمكنك تصفّح المجلدات التي لديك صلاحية الوصول إليها، وإنشاء أصول قابلة للاكتشاف من خلال اختيار حاوية أو أحد المجلدات، ثم اختيار Publish to Catalog.

يؤدي هذا الإجراء إلى إنشاء أصل في SageMaker Catalog من نوع “S3 Object Collection”، ويفتح صفحة ASSET DETAILS حيث يمكن للمستخدمين إضافة سياق أعمال لتحسين إمكانية البحث والاكتشاف. وبعد النشر، يمكن لمستهلكي البيانات اكتشاف هذه الأصول المفهرسة والاشتراك بها. وعند اشتراكهم في أصول من نوع “S3 Object Collection”، يقوم SageMaker Catalog تلقائيًا بمنحهم صلاحية الوصول باستخدام S3 Access Grants بعد الموافقة، مما يسهّل التعاون بين الفرق مع ضمان منح الوصول للمستخدمين المناسبين فقط.

بعد حصولك على صلاحية الوصول، يمكنك الآن معالجة البيانات غير المنظمة داخل Jupyter notebook في Amazon SageMaker. توضح لقطة الشاشة التالية مثالًا على معالجة صورة ضمن حالة استخدام طبية.

إذا كانت لديك بيانات منظمة، يمكنك الاستعلام عنها باستخدام Amazon Athena أو معالجتها باستخدام Spark داخل Jupyter notebooks.

مع منح هذا الوصول من خلال S3 Access Grants، يمكنك دمج بيانات S3 بسلاسة ضمن سير عملك — سواءً لتحليلها في Jupyter notebooks، أو دمجها مع البيانات المنظمة في Lakehouse وAmazon Redshift للحصول على تحليلات شاملة. كما يمكنك الوصول إلى البيانات غير المنظمة مثل المستندات والصور عبر Jupyter notebooks لتدريب نماذج تعلم الآلة أو لاستخراج رؤى قابلة للاستعلام.

الاستيراد التلقائي للبيانات من lakehouse

يعمل هذا التكامل على استيراد جميع مجموعات بيانات lakehouse تلقائيًا إلى SageMaker Catalog. وتتمثل الفائدة الأساسية في جلب مجموعات بيانات AWS Glue Data Catalog (GDC) إلى SageMaker Catalog دون الحاجة إلى إعداد يدوي للفهرسة أو المشاركة أو الحوكمة المركزية.

يتطلب هذا التكامل وجود إعداد lakehouse مسبق يحتوي على Data Catalog يضم مجموعات البيانات المنظمة الخاصة بك.

عند إعداد نطاق SageMaker، يقوم SageMaker Catalog تلقائيًا بجلب البيانات الوصفية (metadata) من جميع قواعد بيانات lakehouse والجداول. وهذا يعني أنه يمكنك استكشاف هذه البيانات واستخدامها مباشرة من داخل SageMaker Unified Studio دون الحاجة إلى أي إعداد إضافي.

يساعدك هذا التكامل على بدء إدارة هذه الأصول وحوكمتها واستهلاكها من داخل SageMaker Unified Studio، مع تطبيق نفس سياسات الحوكمة وضوابط الوصول المستخدمة لبقية أنواع البيانات، مع توحيد البيانات الوصفية الفنية والتجارية.

نقاط إضافية يجب معرفتها

إليك بعض النقاط المهمة:

  • التوافر – هذه التكاملات متوفرة في جميع مناطق AWS التجارية التي تدعم Amazon SageMaker.
  • التسعير – تُطبق أسعار SageMaker Unified Studio وQuickSight وAmazon S3 القياسية. لا توجد رسوم إضافية على هذه التكاملات.
  • الوثائق – يمكنك العثور على تعليمات الإعداد الكاملة في وثائق SageMaker Unified Studio.

ابدأ باستخدام هذه التكاملات الجديدة من خلال وحدة تحكم Amazon SageMaker Unified Studio.

تجربة بناء موفقة!


بتصرف عن المقالة الأصلية