KPMG הסירה דוח על Agentic AI בעקבות טענות לציטוטים שגויים ומקרי בוחן מטעים

KPMG הסירה מאתריה דוח על Agentic AI וחוויית לקוח, לאחר שחוקרי GPTZero ואחרים הצביעו על ציטוטים שגויים, ייחוסים בעייתיים ודוגמאות שלא תאמו את המציאות. הפרשה ממחישה עד כמה גם ארגונים גדולים עלולים להפיץ מידע מטעה, כאשר השימוש בבינה מלאכותית אינו מלווה בבקרת איכות, אימות מקורות ופיקוח אנושי הדוק.

תגיות
KPMGAIGPTZeroAgentic AIהזיות
מניות רלוונטיות:⚠️ ניתוח AI - אינו ייעוץ פיננסי
UBSUBS Group AG
UBS הוזכרה ישירות כאחד הארגונים שלפי הדיווחים תוארו באופן מטעה בדוח. אף שהפגיעה המרכזית היא ב-KPMG, אזכור שלילי ולא מדויק סביב שימושי AI עלול ליצור רעש תדמיתי ולחץ שלילי מתון על המניה.

KPMG, אחת מפירמות הייעוץ והביקורת הגדולות בעולם, הסירה בימים האחרונים דוח שפרסמה על השימוש הגובר ב-AI, לאחר שורה של טענות שלפיהן המסמך כלל שגיאות עובדתיות, ציטוטים בעייתיים ותיאורים לא מדויקים של האופן שבו ארגונים משתמשים בפועל בטכנולוגיה. לפי דיווחים ב-TechCrunch ובכלי תקשורת נוספים, הדוח, שפורסם במקור באוקטובר 2025 תחת הכותרת "Total Experience: Redefining Excellence in the Age of Agentic AI", נמשך מאתרי החברה לאחר שחוקרי GPTZero הצביעו על דפוסים שמזוהים עם "הזיות" של מערכות AI. האירוע בולט במיוחד משום שמדובר במסמך שנועד להסביר כיצד ארגונים מאמצים AI, אך הפך בעצמו לדוגמה מוחשית לסיכון שבשימוש בלתי מבוקר בכלים כאלה.

מה בדיוק נמצא בדוח שנמשך

לפי ממצאי GPTZero, מתוך 45 הפניות ומקורות שהופיעו בדוח, רק חמש נמצאו תואמות באופן מדויק למקורות אמיתיים כפי שהוצגו. יתר ההפניות כללו, לפי החוקרים, כותרות שעברו פרפרזה, ייחוס שגוי למחברים או למו"לים, מרכיבים מומצאים, ולעיתים גם מקורות שהיה קשה מאוד לאמת. ב-GPTZero תיארו את התופעה כ-vibe citing, כלומר יצירה של ציטוט שנשמע אמין ומקצועי אך אינו תואם במדויק מקור קיים. מעבר לבעיית ההפניות עצמן, החוקרים טענו כי חלק מהטענות המהותיות שנועדו להמחיש שימושים ב-Agentic AI בארגונים היו שגויות, מנופחות או לכל הפחות מטעות. המשמעות היא שלא מדובר רק בבעיית פורמט או עריכה רשלנית, אלא בליקוי שעלול לשנות את הבנת הקורא לגבי היקף האימוץ של AI בשוק.

  • רק חלק קטן מן הציטוטים אותרו כמקורות מדויקים ואמינים.
  • מקורות רבים כללו כותרות משובשות, ייחוס שגוי או מרכיבים שלא הופיעו במקור האמיתי.
  • חלק ממקרי הבוחן בדוח תיארו שימושים ב-AI באופן שלפי הדיווחים לא שיקף את המציאות בארגונים שהוזכרו.

הביקורת החריפה לא הסתכמה בבדיקה טכנית של הערות שוליים. לפי הדיווח שצוטט ב-TechCrunch, כמה מהארגונים שהוזכרו בדוח עצמו דחו את האופן שבו תוארו. בין השמות שעלו נמצאים UBS, שירות הבריאות הלאומי של בריטניה, Swiss Federal Railways ו-Transport for London. לפי הדיווחים, הגופים הללו אמרו שהטענות על השימוש שלהם ב-AI היו לא נכונות או מטעות. זו נקודה קריטית: כאשר פירמת ייעוץ גלובלית מפרסמת דוח על מגמות שוק ומציגה מקרי בוחן של ארגונים מוכרים, הקוראים נוטים להתייחס לכך כאל חומר מבוסס. אם הדוגמאות אינן מדויקות, לא רק המוניטין של KPMG נפגע, אלא גם איכות הדיון הציבורי והעסקי על AI.

תגובת KPMG והמשמעות המיידית

KPMG אישרה כי הסירה את הדוח מאתריה בזמן שהיא בודקת את הנושא. לפי הצהרת דובר החברה שצוטטה ב-TechCrunch, KPMG מצפה מכל עובדיה לפעול לפי הנחיות לשימוש אחראי ב-AI, לרבות פיקוח אנושי, אימות תוכן ובדיקת מקורות עצמאיים. הניסוח הזה חשוב משום שהוא משקף את לב הבעיה: ברוב הארגונים הגדולים כבר לא מתקיים ויכוח אם להשתמש ב-AI, אלא כיצד לשלוט בתהליך. דוח שיווקי, מחקרי או אסטרטגי עשוי לעבור כיום דרך כמה שכבות של עיבוד אוטומטי, סיכום, ניסוח או הרחבה. אם אין תהליך בדיקה קפדני בקצה, טעויות קטנות עלולות להפוך למסמך רשמי שנושא לוגו של ארגון מהשורה הראשונה. במקרה של KPMG, עצם ההסרה מאותת שהחברה הבינה כי הנזק האפשרי גדול מהתועלת שבהשארת המסמך באוויר.

הפרשה הזו בולטת גם בגלל העיתוי. בשנה האחרונה יותר ויותר פירמות, בנקים, גופי מדיה וארגוני מחקר אימצו כלים גנרטיביים לאיתור מקורות, לכתיבת טיוטות, לסיכום מגמות ולהפקת תובנות ראשוניות. אלא שהנוחות התפעולית מסתירה לעיתים חולשה בסיסית: מודל שפה יכול לייצר טקסט שנראה סמכותי מאוד גם כשהוא משלב הנחות לא מבוססות, נתונים לא מדויקים או ציטוטים שאינם קיימים. כשזה קורה במסמך פנימי, הנזק מוגבל יחסית. כשזה קורה בדוח פומבי של מותג כמו KPMG, הטעות מקבלת תוקף מוסדי ועלולה להתפשט הלאה דרך תקשורת, לקוחות, מצגות הנהלה ואפילו מנועי חיפוש ומודלים אחרים שמתבססים על החומר הזמין ברשת.

לא אירוע בודד: דפוס רחב יותר בתעשיית הייעוץ

האירוע של KPMG לא התרחש בחלל ריק. לפי דיווחים בחודש מאי 2026, גם EY משכה דוח אחר לאחר טענות על הערות שוליים שגויות, מקורות לא קיימים ותוכן שנראה ככזה שנוצר או הורחב בעזרת AI ללא בקרה מספקת. עוד קודם לכן עלו טענות דומות נגד עבודות מחקר וייעוץ במוסדות נוספים, כולל בדיקות שעסקו במסמכים ממשלתיים, אקדמיים ומסחריים. המשמעות היא שלא מדובר בכשל נקודתי של ארגון אחד בלבד, אלא בסימפטום של לחץ גובר לייצר יותר תוכן, מהר יותר, בעלות נמוכה יותר, תוך הישענות על כלים אוטומטיים. בפירמות הייעוץ הגדולות הלחץ הזה חד במיוחד, משום שהן מוכרות לא רק שירות אלא גם אמינות. דוח מחקר הוא מבחינתן מוצר שמבסס מומחיות, מייצר לידים מסחריים ומשפיע על שיח שוק. לכן כל כשל בו נוגע ישירות בליבת המותג.

  • פירמות ייעוץ פועלות בלחץ גבוה לייצר מחקרים, סקירות ותוכן מנהלים בקצב מהיר.
  • כלי AI מסוגלים להאיץ את התהליך, אך גם להחדיר טעויות שנראות משכנעות על פני השטח.
  • כאשר כשל כזה מתפרסם תחת מותג מבוסס, הוא עלול להשפיע על לקוחות, משקיעים, רגולטורים והתקשורת גם יחד.

מבחינה מקצועית, אחת הנקודות המעניינות בפרשה היא שהטעות אינה בהכרח תוצאה של "המצאה מלאה", אלא של ערבוב בין עובדות אמיתיות, כותרות קרובות, ניסוחים כלליים וייחוסים חלקיים. זו בדיוק הסיבה שמסמכים כאלה מסוכנים: הם לא תמיד נראים מופרכים. להפך, הם לעיתים נשמעים מתקבלים על הדעת ומסתדרים היטב עם הסיפור שהארגון רוצה לספר. בדוח של KPMG, לפי חוקרי GPTZero, מערך ההפניות והדוגמאות ככל הנראה שיקף מצב שבו כלי AI "התאמץ לרצות" את הבקשה למצוא הוכחות לחדירת Agentic AI לשוק. התוצאה הייתה טקסט משכנע לכאורה, אך כזה שאינו עומד בסטנדרט הראייתי המצופה ממסמך ייעוצי או מחקרי.

למה זה חשוב במיוחד בעולם ה-AI

יש כאן פרדוקס כמעט מושלם: ככל שיותר ארגונים מפרסמים דוחות על אימוץ AI, כך גובר הפיתוי להשתמש ב-AI כדי לייצר את הדוחות עצמם. במובן הזה, הפרשה של KPMG היא תזכורת לכך שהבעיה העיקרית של AI גנרטיבי אינה רק שאלת היכולות, אלא שאלת המשמעת הארגונית סביבו. מודלים יודעים לנסח, לארגן ולהציע, אך אינם מחויבים לאמת באופן שבו מחויב אליו חוקר אנושי או עורך מנוסה. אם תהליך העבודה בנוי כך שהמערכת מייצרת טיוטה והצוות מסתפק בליטוש סגנוני, הסיכון עצום. גם כאשר הנתון הבודד נראה שולי, הצטברות של נתונים קטנים, ייחוסים שגויים ודוגמאות בעייתיות יוצרת מסמך שמטעה בקנה מידה רחב. בעולם שבו חברות בונות אסטרטגיה, תקציבים ומדיניות על בסיס סקירות שוק, זה כבר לא עניין של ניסוח, אלא של ממשל תאגידי.

מבחינת השוק, המקרה גם פוגע באחד הנרטיבים המרכזיים של ספקי AI ויועצים עסקיים: ההבטחה שאפשר להאיץ עבודת ידע בלי לשלם מחיר מהותי באיכות. בפועל, מה שרואים שוב ושוב הוא שהעלות לא נעלמת, אלא משנה צורה. במקום להשקיע יותר זמן במחקר ראשוני, הארגון נדרש להשקיע יותר באימות, בבקרת איכות, בבדיקת מקורות ובהצלבת טענות. אם הוא אינו עושה זאת, החיסכון הזמני מתחלף בסיכון מוניטיני, משפטי ועסקי. לכן חברות שמבקשות להטמיע AI בתהליכי כתיבה, אנליזה או ייעוץ צריכות לבחון לא רק את רמת המודל, אלא גם את מבנה האחריות: מי מאשר, מי בודק, מי חותם, ומהו הנוהל כאשר יש אי-התאמה בין טקסט משכנע לבין מקור ממשי.

  • AI יכול לקצר משמעותית את זמן ההפקה של דוחות ומסמכי הנהלה.
  • ללא שכבת אימות אנושית חזקה, החיסכון בזמן עלול להפוך במהירות לעלות מוניטינית ותפעולית.
  • במיוחד במסמכים על שווקים, רגולציה וטכנולוגיה, בדיקת מקורות חייבת להיות חלק בלתי נפרד מהתהליך ולא שלב רשות.

הזווית הישראלית: מה ארגונים מקומיים צריכים ללמוד

מנקודת מבט ישראלית, הסיפור הזה רלוונטי מאוד. בישראל, כמו בשווקים אחרים, ארגונים גדולים, חברות טכנולוגיה, גופי פיננסים, משרדי עורכי דין, חברות ייעוץ וגופים ציבוריים מנסים לשלב AI בתהליכי עבודה כמעט בכל שכבה: ממענה ללקוחות ועד ניתוח מסמכים, ניהול ידע והפקת תוצרים שיווקיים. דווקא משום שהאקוסיסטם המקומי נוטה לאמץ טכנולוגיות במהירות, חשוב להפנים שהבעיה אינה רק אם הכלי "עובד", אלא אם המערכת הארגונית בנויה כך שתאתר טעויות לפני שהן יוצאות החוצה. עבור חברות ישראליות שמוכרות שירותי AI או ייעוץ מבוסס AI, הפרשה של KPMG היא גם עניין תדמיתי: לקוחות בעולם יהיו חשדניים יותר כלפי מסמכים, מצגות וניתוחים שנראים גנרטיביים מדי או שאינם מגובים במקורות ברורים.

בפועל, המסר למנהלים בישראל פשוט למדי אך לא קל ליישום. אין די במדיניות כללית של "שימוש אחראי". צריך לנסח נהלים מפורטים: אילו משימות מותר להעביר ל-AI, כיצד מתעדים שימוש, מי מבצע Fact-check, מהו רף ההוכחה הנדרש לפני פרסום, ואיך מתמודדים עם טענות של צדדים שלישיים שהוזכרו במסמך. בפרט, כל מסמך שמציג מקרי בוחן של לקוחות, נתוני שוק, ציטוטי מחקר או מגמות רגולטוריות חייב לעבור אימות עצמאי מול המקור הראשוני. זה נכון בדוחות פנימיים, אבל קריטי שבעתיים במסמכים פומביים, שעלולים להפוך תוך שעות לחומר מצוטט בהרצאות, בניוזלטרים ובמודלים אחרים. הסיפור של KPMG הוא אפוא לא רק מבוכה תאגידית, אלא אזהרה מערכתית לשוק כולו.

בשורה התחתונה, פרשת KPMG ממחישה עד כמה שביר הקו בין פרודוקטיביות לבין אובדן אמינות בעידן ה-AI. לפי הדיווחים, דוח שנועד לתאר את עלייתו של Agentic AI הוסר לאחר שעלו טענות כבדות משקל בדבר ציטוטים שגויים, דוגמאות מפוקפקות וייחוס מטעה של שימושים ארגוניים. עבור KPMG זהו אירוע מוניטיני לא נעים; עבור התעשייה כולה זהו מבחן מציאות. השאלה כבר אינה אם AI ייכנס עמוק יותר לעולמות המחקר, הייעוץ והכתיבה העסקית, אלא באילו בלמים, בדיקות ואחריות אנושית הוא ילווה. בלי זה, גם הדוח המלוטש ביותר עלול להפוך מהצהרת מומחיות להוכחה חיה לכך שהכלי אומץ מהר יותר מן הבקרה שנדרשת כדי לרסן אותו.

טוען...