כריית מידע

מה זה כריית מידע?

כריית מידע או כריית נתונים או Data mining הוא אוסף של יכולות טכנולוגיות לצורך גילוי ומציאת מידע הטמון בבסיסי הנתונים והסקת מסקנות מהצלבתו. תהליך זה קיים על מנת לנתח ולחקור כמות רבה של מידע ונתונים באמצעות כלים אוטומטיים, בכדי לגלות דפוסים בתוך המאגר, לטובת ייעול תהליך קבלת החלטות מושכלות על כלל המאגר. באמצעות תהליך כריית המידע אנו הופכים את המידע – לידע.

כריית מידע הינה שלב אחד בתוך תהליך מורכב של גילוי ידע בבסיסי הנתונים. ישנם שלבים מוקדמים יותר של חיתוך המידע, וישנם גם חלקים במקביל לתהליך כריית המידע, לדוגמה: ניתוח תוצאות. המורכבות בתהליך כריית המידע היא סיווג וניתוח של אשכולות מידע במאגר נתונים.

מה כולל תהליך כריית המידע?

תהליך כריית המידע מחולק ל-3 שלבים עיקרים:

  • בשלב הראשון מתבצע עיבוד מוקדם של המידע. זהו תהליך בניית מחסנים למאגר או למחלקות בתוכו, ויצירת מסננים מתאימים עבור המאגר בשביל לנקות 'רעשים' במידע. בשלב זה גם מתחיל אימון האלגורתימים וסדרת בדיקות על מנת לאמת את התוצאות של עיבוד הנתונים.
  • השלב השני הינו כריית המידע עצמו אשר נעשה באמצעותם של אלגוריתמים רבים המנתחים אשכולות נתונים ומפלחים את המידע. בתהליך זה גם קיימת מערכת שתפקידה למצוא פונקציה אשר מדללת את המידע תוך מזעור יכולות חיזוי על המידע. החלק המרכזי בשלב השני הינו למידה של חוקים וקשרים בתוך מאגר הנתונים, כאשר האלגוריתמים במערכת מנסים למצוא חוקיות בתוך המאגר – בשביל ליצור קשרים מוכחים בין שדות שונים בבסיס הנתונים.
  • השלב השלישי בכריית מידע הינו אימות התוצאות, כאשר המטרה היא לאמת את התבניות שנמצאו במאגר. לא תמיד כל התבניות אשר נמצאו הינן תקפות, ולעיתים מוצאים תבניות אשר נמצאו כבר בשלב האימון ואכן תקפות על המאגר.
כריית מידע - אילוסטרציה
כריית מידע - אילוסטרציה

להצעה אטרקטיבית - השאירו פרטים:

עמודי האתר

מלאו את הפרטים

ונציג מטעמינו יחזור אליכם בהקדם

דילוג לתוכן