מהפכת הסוכנים, העתיד של ה-QA

אנחנו חיים בתקופה מאוד מעניינת מקצועית, תקופה שהיא החלק התחתון של גרף אקספוננציאלי שהולך להתפוצץ בעתיד הקרוב – רחוק.

בשביל להסביר את הטענה שלי, צריך להכיר 2 מושגים עיקריים:
בינה מלאכותית כללית (AGI) ו-אינטליגנציית-על (Superintelligence).
ה-AGI היא בינה מלאכותית בעלת יכולות חשיבה ולמידה כלליות ברמה אנושית, בניגוד ל-AI הצר שאנו עובדים איתו היום – זה שמתמקד במשימה ספציפית, ה-AGI מסוגל ללמוד ולהבין כל משימה אינטלקטואלית שבני אדם יכולים לבצע, ולהגיע בביצועיו לרמה השווה לזו של אדם.
במילים אחרות, מערכת AGI תוכל להכליל ידע בין תחומים שונים, לפתור בעיות חדשות ללא התאמה מיוחדת מראש, ולבצע מגוון רחב של מטלות באופן גמיש – בדיוק כפי שבני אדם יכולים.

ה-Superintelligence היא למעשה ההמשך של AGI, שתגיע לדעתי כמה שנים אח"כ, זוהי מערכת בינה שעולה בהרבה על האינטליגנציה של מיטב בני האדם בכל תחום שהוא, אם AGI שואף להשתוות ליכולת אנושית, אינטליגנציה-על היא שלב מעבר לכך: בינה מלאכותית בעלת כושר חשיבה ופתרון בעיות גבוה בסדר גודל שלם מזה של גאון אנושי.

אז קצת לסבר את האוזן:
המודלים המתקדמים ביותר כיום כבר מתקרבים (במדדים מסוימים) לרמת אינטליגנציה אנושית גבוהה. למשל, באחת הבדיקות צוין כי המודל העדכני של OpenAI ה- "GPT-o3", השיג ציון המקביל ל-IQ של כ-136 במבחנים סטנדרטיים – רמה השייכת לכמה האחוזים העליונים באוכלוסייה. זו רמת אינטליגנציה השווה בערך לזו של גאונים אנושיים יוצאי דופן.

אמנם "IQ" למכונות הוא מושג בעייתי (מכיוון שהמבחנים מותאמים לבני אדם), אך נתון זה נותן אינדיקציה לכמה חזקים המודלים הנוכחיים כבר יכולים להיות בחלק מהמשימות הקוגניטיביות.
עכשיו, דמיינו עתיד שבו AI משתפר עוד בסדרי גודל – נניח בינה מלאכותית עם יכולת שקולה באופן גס ל-"IQ 400". על סולם ה-IQ האנושי, 400 הוא מספר דמיוני. משמעו למעשה סופר-אינטליגנציה – מערכת שחוכמתה עולה על כל אדם בהיסטוריה, ולא רק במעט אלא בהרבה מאוד. מערכת כזו הייתה מעולה יותר מבני אדם בכל תחום אפשרי של חשיבה.
היא הייתה יכולה לפתח טכנולוגיות וחידושים שהיינו מתקשים אפילו לדמיין, לפתור בעיות מחקר מורכבות תוך שעות במקום עשורים, ולנהל מערכות חברתיות וכלכליות באופן אופטימלי יותר מכל צוות מומחים אנושי.

ואם אתם שואלים, איך בכלל ניתן להגיע ל-"IQ 400"? מרגע שמערכת מגיעה לרמת אינטליגנציה כללית אנושית, היא יכולה ליישם את היכולות שלה על שיפור עצמי מהיר, ובכך ליצור AI חזק עוד יותר. או במלים אחרות – בינה שמפתחת את עצמה.

יופי אמרתי הרבה, אבל איך זה הולך להשפיע על התחום שלנו ?
אין ספק שתחום ה-QA הוא בין התחומים שעומדים בפני טרנספורמציה משמעותית בעידן ה-AI והאוטומציה. אני מאמין שבעתיד הלא מאוד הרחוק (הערכה שלי – 10 שנים מהיום) גם עבודות הפיתוח וגם עבודות הבדיקות יבוצעו ברובן על ידי AGI. מערכות כאלו עתידיות צפויות להיות מסוגלות:
1. יצירת מקרי בדיקה מקיפים – ליצור באופן אוטומטי סטים שלמים של בדיקות לכל פונקציונליות ותסריט שימוש אפשרי, בהתבסס על תיאור הדרישות או הקוד. בכך יובטח כיסוי מבחנים רחב מאוד ללא פערים (כולל מקרי קצה שהאנוש אולי היה שוכח).
2. בדיקות רציפות ותיקון עצמי – להריץ בדיקות בצורה מתמשכת בכל פעם שמתבצע שינוי בקוד (Continuous Testing), לזהות מיד רגרסיות ותקלות חדשות, ואף לעדכן ולתקן בעצמן את תסריטי הבדיקה כאשר המערכת משתנה. למעשה, ה-AI יוכל לממש בדיקות " self-healing " – בדיקות שמתאימות את עצמן אוטומטית לשינויים במוצר כדי להישאר רלוונטיות
3. ניתוח וחיזוי של תקלות – להשתמש בביג-דאטה ובידע נצבר מפרויקטים קודמים כדי לחזות איפה עלולות לצוץ תקלות. למשל, המערכת תזהה דפוסים בקוד או בעיצוב המוצר שנוטים historically לגרום לבאגים, ותתריע למפתחים/בודקים להתמקד באזורים אלו, עוד לפני שהתקלה ארעה בפועל

בנוסף ליכולות הללו, AGI יהפוך את תהליך הבדיקה ליותר מהיר ומקבילי – הוא יוכל להריץ אלפי תרחישי בדיקה בו-זמנית בסביבת סימולציה, לכסות חודשים של עבודה במספר שעות, ולשפר בהתמדה את סט הבדיקות לפי תוצאות הרצות קודמות.

כל זה מוביל לשינוי תפקיד עבור הבודק האנושי. במקום לכתוב ולבצע בדיקות ידניות, תפקיד הבודקים יהפוך יותר לפיקוח, אימות והנחיה של מערכות ה-AI שעושות את הבדיקות:
1. הגדרת מטרות ודרישות – בודקי תוכנה יספקו את ה"קלט" הגבוה-רמה למערכת הבדיקה האוטומטית: מה מטרות הבדיקה, אילו קריטריונים פונקציונליים ועסקיים חשוב לוודא, ומה רמת האיכות הנדרשת. למעשה, הבודק יהיה זה שמגדיר ל-AI מה נחשב "מעבר" או "כשל" במונחי חוויית משתמש ודרישות עסקיות.
2. ניטור וניתוח תוצאות – ה-AI אמנם יריץ את המבחנים, אך בני אדם יצטרכו לעבור על דוחות ותוצאות כדי לזהות הקשרים או חריגים שה-AI עלול לפספס. למשל, אם בדיקות אוטומטיות עברו אך חוויית המשתמש עדיין לא טובה, או אם יש תרחיש שימוש לא צפוי שלא נבדק. הבודק יהווה שכבת ביקורת לוודא שהאוטומציה אכן בודקת את הדבר הנכון.
3. התמקדות בהיבטי יצירתיות ואתיקה (יישור קו מול ערכים אנושיים) – ישנם תחומים בהם לחשיבה האנושית יש יתרון (לפחות בעתיד הקרוב): למשל, הבנה אמפתית של חוויית משתמש, שיקולי נוחות, UI/UX, וכן הימנעות מהטיות ופגיעה במשתמשים. הבודקים יצטרכו לבדוק את המערכות גם מהזוויות האלה – לוודא שה-AI של המוצר מתיישר עם ערכים אנושיים, שאין בבדיקות ובקוד הטיות מזיקות, וששיקולים מוסריים נלקחים בחשבון. תפקיד הבודק עשוי להתפתח למעין בקר איכות אתית בנוסף לבקר טכני.

אז במקום "Quality Assurance" במובן הצר של מציאת באגים, תפקיד ה-QA יהפוך ל"Quality Supervision". פיקוח על איכות והכוונת הבינה המלאכותית הבודקת. הבודקים יעבדו בצמוד למפתחים כדי לתרגם דרישות עסקיות ובקרות אנושיות לאותם כלי AI שמריצים את הבדיקות. חשוב לציין שמעבר זה לא אומר שהבודקים ייעלמו מיד: בטווח הקרוב עדיין יהיה צורך בידע דומיין, בהגיון אנושי ובהסקת מסקנות יצירתית של בודקים כדי לוודא שה-AI לא מפספס משהו מהותי. אך ככל שה-AI יתחכם, הוא ייקח על עצמו יותר מהעבודה הסיזיפית, ותפקיד הבודקים יהפוך יותר אסטרטגי – הגדרת מדיניות איכות, בחינת השינויים הגדולים, ובדיקת הדברים שמעבר ליכולת המכונה (עד שזו תהפוך טובה גם בכך).

אני מאמין כי ייווצרו תפקידים חדשים בעולם הבדיקות, למשל: מאמן AI לבדיקות, או אנליסט איכות ובטיחות (זה שבוחן את מערכת ה-AI עצמה למניעת תרחישים לא בטוחים) ובגדול – לוודא שהטכנולוגיה משרתת נאמנה את מטרות המוצר והמשתמש.

דבר נוסף:
ברמות סופר-אינטליגנטיות, המערכת תוכל להבין מוצר תוכנה לעומקו, להבין את כוונת המשתמשים, לכתוב לעצמה גם את הקוד וגם את הבדיקות, להריץ מיליוני תרחישים ולתקן אוטומטית כל בעיה שתמצא. תפקיד הבודק האנושי בשלב זה עשוי להצטמצם לכמעט אפס וסביר שייעלמו גבולות מקצועיים רבים כמו למשל: ההבחנה בין "מפתח" ל"בודק" ל"אנליסט" מטשטשת כאשר AI כל-יכול עושה את רוב הדברים.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

Scroll to Top
דילוג לתוכן