• Dana&Eyal

מסע בעולם של נתונים - אבולוציית ניתוח המידע מBI ועד ML וAI

בשנים האחרונות מרגישים שינוי בכיוון הרוח

מכירים את הסצנה הנהדרת במלך האריות בה אבא של סימבה מלמד את בנו איך לזהות שינוי של כיוון הרוח ?אז זהו .....גם בימים אלו יש שינוי בכיוון הרוח פה בשוק המקומי בגזרת הדאטה

אנחנו בעידן של בשלות דאטה ארגונית ואם ננסה להמחיש את השלבים שארגון עובר אז לדעתי התמונה הזו ממחישה מצוין את ההתפתחות של עולם הדאטה הארגוני משלב BI עד לשלב המתקדם של AI

אין ספק שיותר ויותר ארגונים מזהים את הפוטנציאל של שינוי תמהיל האנליזה שלהם ושילוב של פתרונות ML ו AI במארג הכלים שעומד לרשותם

אז בואו נתחיל לעשות סדר...ולהכיר שלב אחר שלב...

נתחיל עם שלב ה BI

בשלב הזה ארגונים ממוקדים בשאילת שאלות עבר - כמה צרכנים קנו? כמה נטשו ? מה נמכר?, מנתחים מידע על בסיס טבלאות מובנות. מה שמאפיין את השלב הזה שפעילות הדיגיטל לא מהווה את לב הפעילות ולכן מדידת הדיגיטל הינה חלקית, אגריגטיבית ולא פרסונאלית ולא מנוטרת ברמת התנהגות הלקוח. למי שחייב דוגמא : ניתוח פעילות אתר באמצעות Google Analytics

למעשה בשלב זה מנתחים דאטה עבר על בסיס תוצאות. מצלמים מצב ולא מנתחים רצף פעולות.

השלב הבא - שלב הData mining מתפתח לרוב עקב רצון לנתח פעילות דיגיטלית בצורה מעמיקה.

הארגון מעביר את אנליזת הדאטה לחזית הבמה ומשתדל לפעול על בסיס תובנות ולא רק על בסיס תחושות או תוצאות עבר. בשלב זה יש כבר צוות אנליסטים ייעודי שנובר ומחפש בדאטה תובנות פרסונליות ונחשף כבר לעולמות של SQL ומודלי R , פייטון ועוד ולא רק מתבסס על דוחות שמפתחים עבורו ב IT

בשלב הזה ארגונים כבר מתחילים לשלב וגם ללמוד על העבר ולהסיק על העתיד....כמה לקוחות ירכשו מוצר מסוים? אילו לקוחות חזויים לרכוש מוצר כזה ? כמה חזויים לנטוש?

זה נחמד אבל עוד לא שובר שוויון .... בשלב זה היקפי הדאטה יחסית קטנים ותלויים בטעינת דאטה לרוב במהלך לילי ואינם תכופים

ברוב המקרים עולמות הדיגיטל והעולמות הפנימיים מנותחים באופן נפרד כ Silos

הניתוח הוא קבוע וסכמתי , הפרמטרים המשפיעים אינם דינמיים

בשורה התחתונה - רוב עבודת הניתוח היא ידנית ומצריכה משאב זמן הן בIT והן בצד העסקי

אבל כמו שפתחתי וציינתי משב הרוח משתנה ומתגבר ......

בנתיים הלקוחות דיגיטליים / מחוברים / מאמצי טכנולוגיות, אין להם זמן והם חסרי סבלנות ורוצים שליטה, הם דורשים מידע עדכני ושקוף , הם מחפשים יחס ובעיקר הצעת ערך אישית . ובעיקר הם מוכנים לשתף דאטה אם הם מבינים מה יוצא להם מזה ....מכאן שארגונים חייבים לעלות הילוך ולטפל ביותר דאטה ולנתח ממצאים בזמן אמת ולהגיב עם הצעות מתאימות.....ברוך הבא לשלב הMachine Learning ... הגעתם לליגה של הגדולים ....

כי לML יש יכולת לטפל בהיקפי דאטה משמעותיים

כי במודל של ML מתבצע ניתוח אוטומטי ולא ידני.

כי במודלי ML נוסחת הניתוח אינה קבועה אלא דינמית לאור מה שהמכונה לומדת על הדאטה

המטרה בML זה למצוא הקשרים וקורלציות בין משתנים ואיך הם משפיעים על שאלה עסקית שאנחנו רוצים לפתור. כשההבדל משלב הdata mining הינו שאנו לא נדרשים בשלב ה ML להגדיר פרמטרים מראש אלא נותנים למכונה ללמוד לבדה מתוך ה Row Data כששיפור הדיוק מבוצע באופן רציף ואוטומטי ובפרספקטיבה של שאר הנתונים

חשבתם שזה כל כך פשוט ? אז זהו שלא .....גם במימד של ML רצוי שנכיר 2 סוגי למידת מכונה:

למידה מונחית – Supervised – מבוסס אימון, מגדירים את המשתנים מראש, מחלקים למדגם של אימון ובדיקה ומדייקים את המודל באופן שוטף. משמש בעיקר לקלסיפיקציה וחיזוי

למידה בלתי מונחית – Unsupervised –טכניקה שבה מנסים ללמוד את התכונות והמבנה של אוסף דוגמאות נתונים כאשר הנתונים זמינים כפי שהם ללא תוספת שמות השדות/התיוגים. למשל, נתונים הכוללים מידע רפואי על נבדק, כמו: חום, דופק, לחץ דם ללא תיוג המציין אם הנתונים שייכים לאדם חולה או בריא. התובנות לגבי התכונות של הנתונים הבלתי מתויגים יכולות לשמש למשל כדי לזהות אנומליות או כדי לחלק את הנתונים לקטגוריות.

אז אחרי כל זה מה עושים בשלב המתקדם של AI וdeep learning ?

אתם זוכרים את שינוי כיוון הרוח?

אז כאן כבר מדובר בסערה של ממש ....

פריצות הדרך העיקריות מבוססות AI מתרחשות לאור 3 מגמות עיקריות: גידול עצום בהיקף הנתונים, גידול ושיפור בעיבודי מחשוב ומגוון רחב של מקורות דאטה שונים ולא טריוואלים כמו: קול, טקסט, תמונות, סרטונים וכו

ולכן לאור האתגר להתמודד עם היקפים וסוגים שונים של מידע משתמשים במודלים מתמטיים מתקדמים כמו רשת נוירונים שפותחה בהשראת תהליכים מוחיים ובאמצעותם מלמדים את המכונה. מלמדים מכונה לחשוב כאדם

בואו ניקח לדוגמא זיהוי תמונה - כלב או חתול

אם היינו רוצים לפתור את זה באמצעות ML supervise אז היינו צריכים להגדיר משתנים כמו: האם יש לחיה שפם או לא, האם יש לחיה אוזניים ואם כן האם הן עגולות? היינו צריכים להגדיר את כל המשתנים בפנים ואז באמצעות ML לזהות הקשרים שיתמכו בתובנה שיש לפנינו חיה

במקרה של AI מבוסס רשתות נוירונים מלמדים את המערכת בדיוק כמו שהמוח לומד: שכבה אחרי שכבה

מתחילים בשכבה שמסתכלת על הפיקסלים של התמונה. המערכת יודעת למצוא הבדלים בין קווים וצבעים. לאחר מכן היא עוברת למושגים אבסטרקטיים יותר - זיהוי של אוזן, שפם או זנב

זהו מודל הבנוי על סדרה של פעולות כשבסוף הוא מזהה את המכלול . ככל שמעמיקים עוד בשכבות, יכולת הזיהוי של אובייקטים שונים גבוהה יותר

ויפה לראות שכבר יש דוגמאות ליישומי AI בעולם העסקי (בינתיים בעיקר גלובלית ולא מקומית ...) למשל רשת התמרוקים SEPHORA ממנפת שירות מבוססת AR בעזרתו לקוחה יכולה לבחון מה האיפור הנכון לעור שלה . הפתרון מבוסס על אלגוריתמיקה מעולם ה AI

וכמו במקרה של ניתוח תמונה אותו כנ"ל רלבנטי לניתוח טקסטים, מכוניות אוטנומיות, צאט בוטים חכמים,עוזר קולי חכם, ניתוח סרטונים....ועוד מימדים נתמכי AI

אז מה עושים מחר בבוקר?

ראשית מפנימים באיזה שלב הארגון שלכם נמצא . מן הסתם לרוב תמצאו שאתם בשלב ה BI ומתקדמים ביניכם כבר בשלב ה Data Mining

לאחר מכן וכחלק מההערכות לתכנית עבודה 2019 אתם חייבים להכיר פתרונות מקומיים נהדרים מעולמות ה ML וה AI כדי שתוכלו לבחון שינוי של תמהיל כח האנליזה שלכם והעשרתו ביכולות אוטומציה במקביל לאנליסטים אנושיים כדי למקסם ערך ולפתוח פער מול המתחרים בוודאי בעידן של גידול בהיקפי וסוגי הדאטה שעומדים לרשותכם

Data Tapas 2019 ©