בדיקות | בינה מלאכותית | תובנות – חלק 1

DeepSeek R1: לא מהפכה אבל בהחלט מצדיקה את הסופרלטיבים

בטח שמתם לב כי בימים האחרונים עולם הבינה המלאכותית חווה טלטלה ובאז מטורף עם השקת DeepSeek R1 – מודל חדשני שמציג יכולות פורצות דרך. פוסטים, מאמרים, בלוגרים, יוטיוברים – כולם מדברים על השחקן החדש בשוק – גרסת R1 של מודל הבינה המלאכותית: DeepSeek. אמנם גם בגרסתו הקודמת – V3 הוא היה אחד מהמובילים, אבל כאן מדובר בקפיצת דרך כל כך משמעותית שתפסה את תשומת הלב של כולם.

טוב, האמת היא שאני רואה את ההייפ הגבוה למודל זה, הוא בעיקר הפיקנטריה: ארה"ב ששולטת בעולם הבינה המלאכותית פתאום מפסידה את ההגמוניה לסין – יריבתה הגדולה ביותר. זה פחות או יותר מה שכולם מנסים למכור לנו. אני רוצה להסתכל דווקא על היתרונות ואימוץ של טכנולוגיות חדשות מאשר על מאבקי כוח ונבואות זעם. אני מניח שאם DeepSeek הייתה חברה קטנה מוויסקונסין בארה"ב, הבאז היה יורד בהרבה ונשאר בגבולות הבלוגים הטכניים ולא העיתונות הכללית.

כשהגלגל הומצא אי שם לפני 7,000 שנים בעיראק של היום – זו הייתה מהפכה.
כשההודים המציאו את האפס, לפני כ-1,400 שנים – זו הייתה מהפכה.
כשהאחים רייט הצליחו להטיס מטוס לפני 120 שנים – זו הייתה מהפכה.
כשסיטב ג'ובס על על הבמה ב-9 בינואר 2007 והכריז על האייפון הראשון – זו הייתה מהפכה.
כש-DeepSeek הוציאו את מודל ה-R1 ממש לאחרונה – סליחה, זו לא מהפיכה. היא לקחה משהו קיים, הוזילה ושיפרה אותו, מאוד אפילו, אבל הם לא יצרו כאן דרך חדשה בה אנו משנים את הרגלי החיים או העבודה שלנו.

אז על מה המהומה ?
למי שנרדם בימים האחרונים אז חברת DeepSeek הוציאה מודל בינה מלאכותית עם ביצועים מרשימים שמגיעים לרמתם בדיוק למודלים הפופולריים ביותר במינימום משאבים. בעוד שמודלים כמו GPT-4 של OpenAI או Gemini של Google דורשים תקציבים ומשאבי מחשוב אדירים, DeepSeek R1 פותח בתקציב נמוך משמעותית – פחות מ-6 מיליון דולר בלבד. למרות זאת, המודל מצטיין בתחומים כמו מתמטיקה, קידוד והסקת מסקנות (Reasoning), ומציג ביצועים שמשתווים ואף עולים על מתחריו היקרים בהרבה.
כן, אז עם תקציב פיתוח צנוע, ואתגר ישיר לשליטתן של ענקיות ה-AI האמריקאיות כמו OpenAI, Google, Microsoft ואחרות החברה למעשה הספיקה ליצור גלים בשוק ההון, מניות של ענקיות טכנולוגיה כמו Meta, Microsoft ו-Nvidia בעיקר חוו ירידות משמעותיות (האחרונה "הפסידה" חצי טריליון דולר ביום מסחר אחד! כי מי צריך כוח מחשוב חזק עם אלגוריתמים כל כך חכמים ויעילים?). זה שמעיד על ההשפעה החזקה של המודל על תעשיית ה-AI. בנוסף, DeepSeek הפכה לאפליקציה החינמית המובילה בחנות האפליקציות של אפל וגוגל בארה"ב – הישג מרשים שמדגיש את הפופולריות העצומה שלה.

ה-DeepSeek R1 מבוסס על מנוע Qwen, המותאם במיוחד ליעילות אנרגטית וצריכת משאבים נמוכה. השילוב בין כוח חישובי גבוה לדרישות חומרה צנועות הופך אותו לפתרון נגיש יותר עבור עסקים קטנים, סטארט-אפים ומדינות מתפתחות – מה שמבשר על דמוקרטיזציה של טכנולוגיית AI.

השוואה למתחרים המובילים:
OpenAI (GPT-4): חזק מאוד, אך דורש משאבים ותקציבים עצומים.
Google (Gemini): מצטיין ביכולות מולטימדיה ועיבוד שפה טבעית, אך עדיין צורך משאבים כבדים.
Microsoft (Copilot): משולב היטב במערכות של Microsoft ונותן שירות מצוין למשתמשי Office, אך מוגבל לפלטפורמות ספציפיות.
Anthropic (Claude): מתמקד בבטיחות ואתיקה, אך מצריך תשתיות יקרות.
DeepSeek R1: משלב יעילות, ביצועים גבוהים ונגישות – גם בתנאים מוגבלים.

חברים, זהו הפוסט הראשון מבין סדרה של פוסטים בעולם הבינה המלאכותית לתחילת שנת 2025. בפוסט הבא נדבר על סדרת אנלוגיות לחיים האמיתיים כדי שנוכל להבין מושגים מורכבים בעולם ה-AI בקלות ובפשטות – שווה לעקוב.

אהה כן, סביר להניח שהרבה מכם שקראו את הפוסט אמרו לעצמם – רגע, אבל זוהי חברה סינית, האם אפשר לבטוח בהם ? אני אתייחס בדיוק לנקודה זו בהמשך הפוסטים שאפרסם

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

Scroll to Top
דילוג לתוכן