חוקרים מצאו כי חוסמי גיל ההתבגרות והורמונים לא שיפרו את בריאותם הנפשית של ילדים טרנסים במרפאה שלהם.

חוקרים מצאו כי חוסמי גיל ההתבגרות והורמונים לא שיפרו את בריאותם הנפשית של ילדים טרנסים במרפאה שלהם.

ואז הם פרסמו מחקר שטוען את ההיפך.

ביקורת על Tordoff et al. (2022)

הופיע במקור בסאבסטאק של ג’סי סינגל. תרגום של נעמה עציץ וצוות האתר.

מאמר בשם “תוצאות בריאות הנפש אצל טרנסג’נדרים ונוער א-בינאריים המקבלים טיפול מאשר מגדר” פורסם ב-JAMA Network Open בסוף פברואר. המחברים, דיאנה מ. טורדוף, ג’ונתון וו. וונטה, ארין קולין, ססלי סטפני, דיוויד ג’יי אינוורדס-ברלנד וקים אהרן, הם ברובם מאוניברסיטת וושינגטון-סיאטל או מבית החולים לילדים בסיאטל.

במחקרם, החוקרים בחנו קבוצה של ילדים שהגיעו דרך מרפאת המגדר לילדים בסיאטל. הם עקבו אחר הילדים לאורך זמן כשחלקם נטלו חוסמי גיל ההתבגרות ו/או הורמונים. הילדים ניהלו סקרי דיווח עצמי שעוקבים אחר בריאותם הנפשית. במהלך המחקר בוצעו ארבעה סבבים של איסוף נתונים: כשהילדים הגיעו לראשונה למרפאה, שלושה חודשים לאחר מכן, שישה חודשים לאחר מכן ו-12 חודשים לאחר מכן.

המחקר נדחף אל השיח הציבורי על ידי מסע אינטנסיבי של יחסי ציבור מצד אוניברסיטת וושינגטון בסיאטל. זה הצליח – דיאנה טורדוף דנה בממצאים שלה ושל עמיתיה ב-Science Friday, תוכנית רדיו מדעית שבועית פופולרית מאוד, זמן לא רב לאחר פרסום המחקר.

כל חומרי הפרסום שהאוניברסיטה פרסמה מספרים סיפור פשוט ומרגש: לילדים במחקר זה, להם הייתה גישה לחוסמי גיל ההתבגרות או להורמונים (להלן GAM, עבור “רפואה מאשרת מגדר”), חל שיפור בבריאות הנפש בסוף המחקר לעומת תחילתו.

הכותרת של הגרסה שנשלחה בדוא”ל של ההודעה לעיתונות, למשל, אומרת, “ממחקר שנערך עולה כי טיפול מאשר מגדר מפחית באופן דרמטי דיכאון אצל בני נוער טרנסג’נדרים”. במשפט הראשון נכתב, “חוקרי UW Medicine גילו לאחרונה שטיפול המאשר את המגדר למתבגרים טרנסג’נדרים וא-בינאריים גרם לשיעורי הדיכאון לצנוח”. כל אלה מעידים על קשר סיבתי ישיר, כאשר “מפחית באופן דרמטי” ו”גרם לשיעורים… לצנוח” מתקשרים בבירור לשיפור לאורך זמן.

המייל ממשיך:

"טיפול מאשר מגדר הוא טיפול מציל חיים", אמרה ארין קולין, סטודנטית שנה רביעית בבית הספר לרפואה של אוניברסיטת וושינגטון, ואחת ממנהלות המחקר. "לטיפול זה יש כוח רב בשיפור בעיות בריאות הנפש, איתן אוכלוסיית הטרנסג'נדרים מתמודדת באופן גורף בגיל צעיר מאוד."

לגרסת האינטרנט יש כותרת נחרצת פחות אך עדיין מושכת עיניים:

"בממצאי מחקר שפורסמו ב-JAMA Network Open, החוקרים דיווחו כי טיפול מאשר מגדר היה קשור לירידה של 60% בדיכאון וירידה של 73% במחשבות מזיקות או אובדניות בקרב המשתתפים. הם קיבלו את הטיפול שלהם במרפאת המגדר לילדים בסיאטל". כשאנחנו מדברים על "הפחתה" או "ירידה", אנחנו כמובן מתכוונים ל"לאורך זמן".

מסע הפרסום של UW כלל אמצעי מדיה אחרים, כולל סרטון של קולין שדן בממצאים ומסמך של גוגל בכותרת “מסמך תיעוד טיפול מאשר מגדר למתבגרים”. במסמך התיעוד מסבירה קולין: “התוצאות היו מאוד דרמטיות. היה לנו שיעור בסיס של דיכאון של 56.7%, ושיעור בסיס של אובדנות של 43.4% – אבל קבלת כל צורה של טיפול המאשר את המגדר, חוסמי התבגרות או ההורמונים המאשרים את המגדר, הייתה קשורה לירידה של 60% בדיכאון וירידה של 73% באובדנות”. שוב, כל מי שקורא את זה יפרש את טענתה של קולין כ”לילדים האלה היו שיעורי בסיס גבוהים של דיכאון והתאבדות, ואז הם קיבלו חוסמי גיל ההתבגרות או הורמונים, והשיעורים האלה ירדו באופן משמעותי.”

כדי להרחיב את הנקודה, קולין פרסמה את המחקר ב-/r/science ב-Reddit בכותרת “צעירים טרנסג’נדרים ונוער א-בינארי שקיבלו טיפול רפואי מאשר מגדר חוו שיעורים מופחתים מאוד של אובדנות ודיכאון במהלך 12 חודשים.” לפוסט יש 13,400 הצבעות בעד ויותר מ-1,700 תגובות, רבות מהן משבחות את הממצא החשוב. כאן קולין טוענת בצורה ברורה, ללא עוררין, שהילדים שעברו טיפול מאשש מגדר חוו שיפור בבריאות הנפש במהלך המחקר. (יצרתי קשר עם קולין ב-Reddit אבל לא קיבלתי ממנה תגובה). קולין גם פרסמה את זה ב-/r/medicine subreddit עם כותרת ניטרלית יותר, אבל חזרה על אותה טענה: “בקיצור – טרנסג’נדרים וצעירים א-בינאריים שקיבלו טיפול המאשר את המגדר (המוגדר כמתן לאופרוליד, טסטוסטרון או אסטרדיול) מכל סוג, חוו ירידה של 60% בדיכאון הבסיסי וירידה של 73% באובדנות הבסיסית במהלך 12 חודשים”.

זה לא רק חומרי הפרסום; המאמר עצמו מספר סיפור דומה, לפחות כמה פעמים. בתיבת “נקודות המפתח” שנמצאת מימין לתקציר נכתב:

"בקבוצה פוטנציאלית זו של 104 צעירים TNB [טרנסג'נדרים וא-בינאריים] בגילאי 13 עד 20, שקיבלו טיפול מאשר מגדר, כולל חוסמי גיל ההתבגרות והורמונים מאשרים המגדר, היה קשר לסיכויים נמוכים ב-60% לדיכאון בינוני או חמור ולסיכויים נמוכים יותר ב-73% לאובדנות במהלך מעקב של 12 חודשים." 

גוף העיתון מכיל גם לפחות שני משפטים הטוענים בבירור שהילדים שנטלו חוסמים והורמונים חוו שיפור בבריאות הנפש עם הזמן:

"הממצאים שלנו תואמים את הממצאים של מחקרים קודמים שמצאו שמתבגרי TNB נמצאים בסיכון מוגבר לדיכאון, חרדה ואובדנות, ומחקרים שמצאו שיפורים לטווח ארוך וקצר בתוצאות בריאות הנפש בקרב יחידי TNB המקבלים התערבויות רפואיות המאשרות מגדר. המחקר שלנו מספק ראיות כמותיות לכך שגישה לבלוקרים או הורמונים במסגרת רב-תחומית המאשרת מגדר הייתה קשורה לשיפורים בבריאות הנפש בקרב צעירי TNB על פני מסגרת זמן קצרה יחסית של שנה." [הערות סיום הושמטו]

מה שמפתיע, לאור כל הציטוטים הללו, הוא שהילדים שלקחו חוסמי גיל התבגרות או הורמונים לא חוו שיפור מובהק סטטיסטית בבריאות הנפש במהלך המחקר. הטענה שהם אכן השתפרו, שהוצגה לציבור במחקר עצמו, בחומרי פרסום וברשתות החברתיות (שוב ושוב) על ידי אחת הכותבות, שקרית.

קשה אפילו להבין זאת מקריאת המחקר, אשר משמיט כמה סטטיסטיקות בסיסיות ביותר שניתן היה לצפות למצוא, אבל התוצאה די ברורה מטבלה מקוונת מס’ 3 בחומרים הנלווים למאמר, המראה איזה אחוז מהמשתתפים במחקר חוו על פי מדד החוקרים דיכאון, חרדה, פגיעה עצמית או מחשבות אובדניות במהלך כל אחד מארבעת החלקים של המחקר:

בכל נקודת זמן, “PB/GAH” מתייחס לילדים שדיווחו על חוסמי גיל התבגרות או הורמונים מאשרים את המגדר, בעוד “אף אחד” מתייחס לילדים שלא דיווחו על טיפול כזה.

בקרב הילדים שנטלו הורמונים, אין כאן שיפור סטטיסטי אמיתי מההתחלה ועד הגל האחרון של איסוף הנתונים. בתחילת המחקר, 59% מהילדים חוו דיכאון בינוני עד חמור. 12 חודשים לאחר מכן, 56% מהילדים ב-GAM חוו דיכאון בינוני עד חמור. בתחילת הדרך, 45% מהילדים חוו פגיעה עצמית או מחשבות אובדניות. 12 חודשים לאחר מכן, 37% מהילדים ב-GAM חוו זאת. אלו לא הבדלים משמעותיים: הילדים במחקר הגיעו עם מה שנראה כשיעורים גבוהים להחריד של בעיות נפשיות, רבים מהם קיבלו חוסמים או הורמונים, והם סיימו את המחקר עם מה שנראה כשיעורים גבוהים להחריד של בעיות בבריאות הנפש. (אם כי כפי שאסביר, מכיוון שהחוקרים מספקים כל כך מעט נתונים מפורטים, קשה לדעת בדיוק עד כמה המצב הבריאותי הנפשי של הילדים היה חמור).

אם היה שיפור, החוקרים היו מציגים זאת בצורה ברורה וספציפית על ידי הסבר מדויק עד כמה הילדים ב-GAM השתפרו. אחרי הכל, זה בדיוק מה שהם בדקו – הם מפרטים את “שאלת” המחקר שלהם כ”האם טיפול מאשר מגדר עבור צעירים טרנסג’נדרים וא-בינאריים (TNB) קשור לשינויים בדיכאון, חרדה ואובדנות?” אבל הם לא טוענים זאת בשום מקום – לא ספציפית. הם מתייחסים ל”שיפורים” פעמיים (ראו לעיל) אך אינם מציעים הדגמה סטטיסטית בשום מקום בעיתון או בחומרי התוצאות. רציתי לבדוק זאת שוב כדי להיות בטוח, אז פניתי לאחד ממחברי המחקר. והוא אישר לי, לא לציטוט או ייחוס, שאין שיפור במהלך הזמן בקרב הילדים שנטלו הורמונים או חוסמים.

זו הסיבה שאני חושב שאוניברסיטת וושינגטון-סיאטל, JAMA Network Open, ומחברי המחקר הזה פשוט מציגים אותו בצורה שגויה. כל מי שקורא את חומרי הפרסום שלו, או שקורא את המחקר עצמו בצורה שאינה מדוקדקת, או שמוצא את הפוסטים של קולין ב – Reddit, יגיע למסקנה שמחקר זה מצא שגישה ל-GAM שיפרה את תוצאות בריאות הנפש של ילדים טרנסים לאורך זמן.

אבל זה פשוט לא קרה.

איך החוקרים מסוגלים לטעון שהטיפולים עבדו

החוקרים לא יכולים להציע שום ראיה סטטיסטית ספציפית לכך שהילדים שנטלו חסמים והורמונים השתפרו עם הזמן. אז במקום זאת, הם טוענים שלפי מודל סטטיסטי שהם הפעילו, שכביכול מותאם למשתנים מתערבים, הילדים שקיבלו GAM הצליחו טוב יותר מהילדים במדגם שלא קיבלו. בתקציר הם כותבים: “לאחר התאמה למגמות תלויות זמן ומשתנים מתערבים פוטנציאלים, ראינו סיכויים נמוכים ב-60% לדיכאון (יחס סיכויים מותאמים [aOR], 0.40; 95% CI, 0.17-0.95) וסיכויים נמוכים ב-73% לאובדנות (aOR, 0.27; 95% CI, 0.11-0.65) בקרב בני נוער שהחלו ליטול בלוקרים או הורמונים בהשוואה לצעירים שלא. כפי שאישר החוקר שלא לייחוס, זהו ממוצע של תצפיות שנערכו בכל נקודות הזמן במחקר, לא רק השוואה בין תצפיות הבסיס לתצפיות של 12 חודשים.

“שיפור בבעיות נפשיות בקרב ילדים שנטלו X” היא טענה שונה מאוד מ”ילדים שנטלו X לא חוו שיפור בבריאות הנפש, אבל היו תוצאות טובות יותר בהשוואה לילדים שלא נטלו X.” ההבדל הזה חשוב כאן מאוד. אחרי הכל, בוויכוח הנוכחי על חוסמים והורמונים, פזמון נפוץ מאוד הוא שהתרופות הללו מסייעות באופן רב לשיפור דיכאון ואובדנות, עד שזה חסר אחריות למנוע או לדחות את נתינתן לילדים. לעתים קרובות טוענים שאם לילדים אין גישה לתרופה זו, הם יהיו בסיכון גבוה להתאבדות. טענה זו למעשה אומרת אומרת שעם נטילת חוסמים או הורמונים, ילד טרנס עם רמות גבוהות של דיכאון או מחשבות אובדניות יחווה הקלה. החוקרים הללו, שלקחו חלק חשוב בוויכוח הזה, גילו שילדים שלקחו את התרופות הללו לא חוו הקלה – ובכל זאת הם לא מזכירים את העובדה המדאיגה הזו בשום מקום במאמר שלהם.

במקום זאת, הם מבססים את הטיעון שלהם על כך שבעוד שהילדים שנטלו תרופות מאששות מגדר נשארו יציבים, הילדים שלא נטלו GAM החמירו. כפי שהסביר החוקר שלא לייחוס בדוא”ל, “כאשר התאמנו את המודלים שלנו לקבלת בלוקרים/הורמונים [כלומר, חוסמי גיל התבגרות והורמונים מאשרים מגדר], ראינו לאחר 3 ו -6 חודשים, שדיכאון ואובדנות החמירו משמעותית בקרב בני נוער שעוד לא נטלו בלוקרים/הורמונים.” אז המסקנה כאן, כפי שהחוקר מודה, לא נובעת מכך שהילדים בקבוצת הטיפול משתפרים, אלא דווקא מכך שהילדים בקבוצת ההשוואה מוחמרים.

זה מביא אותנו לטריטוריה שונה מאוד, מבחינה רפואית. ברור, יש כמה הקשרים שבהם שמירה על יציבות של מישהו עשויה להיחשב כתוצאה טובה. אם אתה נותן למישהו עם סרטן שלב 4 תרופה והיא שומרת את הגידולים שלו באותו גודל במשך חודשים רבים או אפילו שנים, זה לעתים קרובות יחשב ניצחון. אם אתה נותן לחולה אלצהיימר תרופה והיא תעצור את הירידה הנוירוקוגניטיבית שלו לתקופה ממושכת, זה יהיה ניצחון (אני לא חושב שיש לנו אפילו תרופות כאלה). אבל המטרה של חוסמי גיל ההתבגרות ובמיוחד של הורמונים, היא לשפר את מצב הילדים, והם לא השתפרו במחקר הזה. אני לא אומר ששיפור בקבוצת טיפול הוא הכרחי כדי לטעון שטיפול עובד – אתה צריך גם קבוצת בקרה או השוואה (ראו הערת שוליים2 להסבר קצר למה אני מתכוון כאן אם זה מבלבל אותך בכלל), אבל אם אתה נותן למישהו תרופה לטיפול במשהו, והתסמינים שלו לא משתפרים, האם זה לא אמור לגרום לך לתהות אם הטיפול עובד?

הילדים בקבוצה שקיבלה טיפול רפואי מאשש מגדר במחקר זה לא השתפרו עם הזמן. אז אם אנחנו הולכים לקבל את הטענה של החוקרים שהמאמר שלהם מציע הוכחות לכך שטיפול רפואי מאשש מגדר עובד, זה מחייב הכרה בכך שההבדלים בתוצאות בין שתי הקבוצות נגרמו, או נגרמו בעיקר – על ידי הקבוצה שלה לא הייתה גישה לטיפול רפואי מאשש מגדר. אבל למה לנו? 

ישנם הסברים פוטנציאליים רבים אחרים לדפוס התוצאות הזה, והחוקרים מתעלמים מהם ברובם, למעט כמה נקודות שבהן הם מציעים הנחות כלליות למדי והם מאמינים שהם ענו על האפשרות של השמטת משתנים מתערבים.

למרות העובדה ששניים מהכותבים עבדו בבית החולים לילדים בסיאטל, שם מרפאת המגדר נמצאת, המאמר אינו כולל ולו ניחוש מושכל אחד המנסה להסביר מדוע חלק מהילדים קיבלו טיפול רפואי מאשש מגדר ואחרים לא. נראה שהכותבים גם לא שמים לב שעד סוף המחקר, הקבוצה ללא טיפול רפואי מאשש מגדר הצטמצמה לסך כולל של שישה ילדים שדיווחו על נתונים על בריאות הנפש, בהשוואה ל-57 בקבוצה שקיבלה טיפול.

שיהיה ברור, נשירה של משתתפים במחקר כזה היא נורמלית ובלתי נמנעת. אם תבדקו ארבעה סבבים של סקרים, תקבלו הרבה פחות תגובות בסוף מאשר בהתחלה. הבעיה הגדולה יותר היא ההבדל המשמעותי בשיעורי הנשירה בין שתי קבוצות: כאשר קבוצה אחת נושרת מהמחקר בשיעור גבוה בהרבה מהשנייה. זה “מערער את ההנחה שלטיפול ולקבוצת הביקורת יש את אותם מאפיינים בתחילת הדרך, מדודים ולא מדודים”, כפי שמנסח זאת מדריך מועיל שפורסם על ידי צמד חוקרים ב- Mathematica, חברת ניתוח מדיניות ציבורית מובילה. “זה יכול ליצור חוסר איזון בין שתי הקבוצות, אם המאפיינים של אלה שיש להם נתוני מעקב שונים מאלה שאין להם.” (אין קבוצת ביקורת במובן המסורתי במאמר ב-JAMA Network Open, אבל אותו היגיון לגבי שיעורי נשירה דיפרנציאליים חל בכל פעם שמשווים בין שתי קבוצות באופן שמסתמך על “כל השאר הוא פחות או יותר הנחת היסוד שווה”. אם כל השאר רחוק מלהיות שווה, ההשוואה שלך שגויה.)

לרוב המכריע של הילדים שנשרו מהמחקר הזה לא הייתה גישה לטיפול רפואי מאשש מגדר. בסוף המחקר, רק 6/63 מהילדים הנותרים שסיפקו נתונים על בריאות הנפש, או 9.5% ממשתתפי המחקר, היו בקבוצה ללא טיפול מאשש מגדר. בסך הכל, על פי נתוני החוקרים, 12/69 (17.4%) מהילדים שטופלו עזבו את המחקר, בעוד ש-28/35 (80%) מהילדים שלא טופלו עזבו אותו. זהו הבדל עצום. (הם נותרו קבוצה קטנה, אבל לילדים ללא טיפול רפואי מאשש מגדר שעדיין היו בקשר עם המרפאה בתום 12 החודשים, היו גם שיעורים גבוהים מאוד של דיכאון בינוני עד חמור, פגיעה עצמית או מחשבות אובדניות, שעשויות להצביע על משהו יוצא דופן לגביהם בהשוואה לכל השאר בקבוצה.)

(‘עדכון’ שנמחק הגיע לכאן – ר’ הערת שוליים 4.)

מכיוון שהחוקרים אפילו לא מזכירים את ההבדל הגדול הזה בשיעורי הנשירה של שתי הקבוצות, כל מה שאנחנו יכולים לעשות הוא לשער. אבל קל לראות איך זה עשוי להשפיע על הממצאים שלהם. נניח שקומץ מהילדים שהמאפיינים שלהם נמדדו בתחילת הדרך לא היו דיספוריים מגדריים במיוחד, למשל – אולי הם פשוט עברו מחלה קשה, או אולי ההורים השמרנים חברתית שלהם לקחו אותם למרפאת מגדר בגלל “התנהגות לא אופיינית למגדר”, אבל בפועל שום דבר לא באמת היה לא בסדר איתם. ברור שהילדים האלה והוריהם יאבדו קשר עם המרפאה מכיוון שהם לא נזקקו עוד לשירותיה. אם הילדים האלה הצליחו די טוב במהלך השנה הבאה, זה אומר שאתה לוקח קומץ ילדים שייצגו נוער די בריא בקבוצת ההשוואה, ודוחף אותם אל הגדרה של קבוצה פחות בריאה ביחס לממוצע. אז כשהחוקר מאחורי הקלעים אומר לי ש”דיכאון ואובדנות החמירו משמעותית בקרב בני נוער שעדיין לא התחילו PB/GAH בגיל 3 ו-6 חודשים ביחס לרמות הבסיס”, חשוב לזכור שבכל שניים מתוך שלושה גלים חדשים במחקר, ישנם מספרים משמעותיים של ילדים נושרים – ובסך הכל הרוב המכריע של הנושרים הם בצד “ללא טיפול מאשש מגדר”. אם לילדים הנושרים הייתה בריאות נפשית טובה למדי, עלול להיווצר הרושם הכוזב שישנה החמרה בממוצע של קבוצה זו, גם אם אינדיבידואליים בתוכה לא באמת מחמירים. (תארו לכם שיש לכם רק שני ילדים בסבב הבדיקה הראשון, אחד אובדני ואחד לא. אם הילד הלא-אובדני נושר לפני סבב הבדיקה השני והילד האובדני נשאר אובדני, אז במחקר הקבוצה הזו “הדרדרה” מ-50% אובדנות עד 100% אובדנות.) (תיקון: לא הייתי צריך לומר שהייתה נשירה “בכל גל חדש של המחקר”, כפי שעשיתי במקור. בין הגל השני לשלישי לא הייתה נשירה, ולמעשה נראה כי גודל המדגם בטבלה מקוונת מס’ 3 עולה באחד, אולי בגלל שמשתתף שדיווח קודם לא דיווח כעת. אבל במעבר מ-3 חודשים ל-6 חודשים, נראה כי כ-14 חברים בקבוצת ללא טיפול רפואי מאשש מגדר עברו לקבוצת מקבלי טיפול רפואי מאשש מגדר, אז זה אותה בעיה: כשאתה אומר שקבוצת ה-No-GAM החמירה, אתה מדבר על קבוצה שמצטמצמת בגודלה, ונראה שלא סביר שהילדים שעוזבים את המחקר או עוברים לקבוצת מקבלי טיפול רפואי מאשש מגדר עושים זאת באופן אקראי בכל מקרה, הדרך הנכונה לתאר את דפוס הנשירה היא שיש שיעורים משמעותיים של נשירה בין הסבב הראשון והשני, ובין הסבב השלישי לרביעי – ראו טבלאות מקוונות 3 ו-4. אני משאיר את המשפט למעלה עם מילה אחת מחוקה והניסוח החדש מודגש.)

מהצד השני, מה מסביר את קומץ הילדים שלא קיבלו תרופות, אבל כן נשארו בקשר עם המרפאה במשך שישה חודשים או שנה שלמה? מכיוון שהחוקרים מפגינים כזה חוסר עניין לגבי הנתונים המוזרים של המחקר שלהם עצמם, כל מה שאנחנו יכולים לעשות הוא לשער. אפשרות אחת היא שלילדים אלו היו בעיות נפשיות נלוות חמורות או כאלה שהלכו והחמירו, שבעיני הרופאים היה צורך לטפל בהן לפני שניתן יהיה לתת חוסמים או הורמונים. זו תופעה שכיחה למדי במרפאות מגדר לנוער.

למעשה זה שכיח עד כדי כך שהגרסה הבאה המוצעת של הנחיות מתבגרים עבור תקני הטיפול של האיגוד המקצועי העולמי לבריאות טרנסג’נדרים כוללת המלצה זו:

"כאשר מתבגר TGD [טרנסג'נדר או אחר] חווה אובדנות חריפה, פגיעה עצמית, הפרעות אכילה או משברים אחרים בבריאות הנפש המאיימים על הבריאות הגופנית, יש לתת עדיפות לבטיחות. על פי ההקשר וההנחיות המקומיות, טיפול מתאים צריך לשאוף לצמצם איום או משבר, כך שיהיה מספיק זמן ויווצר איזון כדי שתוכל להתבצע הערכה וקבלת החלטות הקשורות למגדר. לדוגמה, יתכן שמתבגר אובדני, לא יהיה מסוגל מבחינה רגשית לקבל החלטה מושכלת בנושא [לכן, מכיוון שהמשפט מסתיים כאן - אני חושב שמה שחסר כאן בהקשר הוא משהו כמו "הטיפולים האלה"]. אם הדבר מאפשר, התערבויות הקשורות לבטיחות אינן מונעות התחלת טיפול מאשר מגדר."

אם אפילו קומץ קטן מהילדים במחקר של טורדוף היו צריכים “מספיק זמן ואיזון להערכה וקבלת החלטות שקשורות למגדר”, זה יכול להסביר חלקית קבוצה של ילדים שחווים בעיות נפשיות שהלכו והחמירו בחלקן יחד עם אי קבלת טיפול רפואי מאשש מגדר. זה מייצג סיבתיות הנעה בדיוק בכיוון ההפוך לטענת החוקרים: במקום שהבריאות הנפשית של הילדים תהיה גרועה בגלל שהם לא נטלו טיפול רפואי מאשש מגדר, הם לא קיבלו גישה לטיפול רפואי מאשש מגדר כי הבריאות הנפשית שלהם הייתה גרועה.

אנחנו לא יכולים לבדוק את התיאוריות האלה כי החוקרים מסרבים לשתף את הנתונים שלהם

חשבתי שלפחות אצליח להתחיל לגעת בכמה מהשאלות האלה על סמך ההתכתבות שלי עם דיאנה טורדוף. היא סטודנטית לדוקטורט באפידמיולוגיה ב-UW–Seattle, הרשומה ככתובת לשאלות בנוגע למאמר, ומי ש”לוקחת אחריות על שלמות הנתונים ועל הדיוק של ניתוח הנתונים”. היא זו שהציגה ל”שישי מדע” את החשיבות של המחקר הזה – עוד על זה בהמשך.

באימייל מ-6 במרץ כתבה טורדוף, “למרות שסיפקנו את הנתונים הגולמיים בחומר הנלווה למאמר לצורך שקיפות, אני ממליצה לנקוט משנה זהירות בפירוש הנתונים האלה כפי שהם.” נהדר, חשבתי; אני יכול למסור את הנתונים למישהו שיותר טוב ממני בדברים האלה ולשאול מה הוא חושב. אלא שהנתונים לא נכללו בפועל בחומרי התוצאות. שאלתי את טורדוף איפה זה. דממת אלחוט. שלחתי מייל המשך מנומס. שוב, כלום.

אז פניתי לאשת התקשורת שחתומה על החומר ש-UW–Seattle שלחה ושאלתי אותה אם הנתונים יהיו זמינים. “ג’סי, יצרתי קשר עם הצוות ואין להם תגובה נוספת בשלב זה”, אמרה אשת יחסי הציבור. “הם החליטו לתת לפרק שיטות המחקר לדבר בעד עצמו”.

הבעיה היא שאין הרבה פירוט על שיטות המחקר, אז יש הרבה שאלות רציניות לגבי תקפות המחקר הזה – כולל האם המחברים נקטו בכלל בגישה הסטטיסטית המתאימה.

החוקרים אולי לא השתמשו בשיטה הסטטיסטית הנכונה

מחברי המחקר של טורדוף ושות’ חישבו את התוצאות שלהם באמצעות שיטה שנקראת משוואות אומדן כלליות. זה מעל הידע הסטטיסטי שלי, אז פניתי למחבר המאמר שאני מאמין שהוא המאמר המצוטט ביותר לגבי הטכניקה הזו שהצלחתי למצוא – ג’יימס הנלי. ג’יימס הוא פרופסור לאפידמיולוגיה וביוסטטיסטיקה באוניברסיטת מקגיל שלימד קורסים רבים בשיטות מחקר, והוא הסכים להסתכל על המאמר. ביקשתי שיקרא וייתן את חוות דעתו. הוא סימן עותק של המאמר בהערות וחוות דעת והסכים להיפגש איתי בפגישת זום אחד על אחד ולהסביר על ממצאיו.

ברמה הבסיסית ביותר של הערכה כללית של הנתונים, הסכים איתי הנלי שהתוצאות שנמסרו בתוצאות המחקר לא בישרו טובות לגבי החוקרים. אם הטיפולים “היו כל כך טובים, האחוזים בסוף הטיפול היו נמוכים בהרבה”, הוא אמר על האחוזים בחלק הימני ביותר של טבלה מקוונת מס’ 3. “כמובן, כל הקבוצה לא נסקרה לאחר 12 חודשים, אז אנחנו לא יכולים לומר איך כל הקבוצה הצליחה באותה נקודת זמן, אבל מבין אלו שנסקרו בסוף יש אחוז ניכר שמדווח על מחשבות אובדניות”. אם הטיפולים הללו אכן הצליחו לטפל באובדנות ובדיכאון, אפשר היה לצפות שהמספרים המקבילים ירדו במידה ניכרת, אבל זה לא קרה.

הנלי גם אמר שהוא פשוט חשב שהחוקרים בחרו בטכניקה מפוקפקת לניתוח שלהם – כזו שמסתירה מאפיינים חשובים של הנתונים שלהם, במיוחד לגבי בעיות הנשירה. הוא תיאר משוואות אומדן כלליות כ”דרך די עלובה להתמודדות עם [סוג זה של נתונים]”. “היום מעט מאוד מנתחי נתונים היו עושים זאת עבור נתונים אורכיים, שבהם יש לך ארבע מדידות על אותו אדם”, הוא אמר. “ישנן דרכים טובות יותר לנתח נתונים כאלה כיום.” הנלי חושב שמה שנקרא מודל רב-שכבתי או הייררכי היה טוב יותר. כמו כן, “במקום לעשות דיכוטומיה של המדדים, השארתם כפי שהם הייתה מאפשרת לנו לראות עקומה עבור כל משתתף.” אני אסביר את זה יותר לעומק בסעיף הבא, אבל כאן הנלי מתכוון לעקומה המראה את מדדי הבריאות הנפשית של כל אדם או קבוצה לאורך זמן. 

בניתוח מסוג זה, אמר הנלי, “נוכל לראות גם היכן נעצר המעקב אחר כל משתתף, והיכן האדם הזה היה כשעזב. יכול להיות שהם עזבו בגלל שהם מרגישים טוב יותר, או בגלל שהם הרגישו שהטיפול לא עוזר להם כל כך”. זה מאפשר לחוקרים “לספור מי עלה ומי ירד” באופן ספציפי יותר, מבחינה בריאותית. “ואפשר יהיה אפילו לומר, במידה והם קיבלו את הטיפול, האם הייתה הידרדרות במצבם? אם כך, זה הרבה יותר שקוף לעשות דברים כמו שצריך לפי המודלים ההיררכיים האלה”. 

בעיה נוספת שהנלי ציין היא ש-17 משתתפים במדגם סיפקו רק נתונים בסיסיים, ולאחר מכן נשרו מהמחקר – ובכל זאת הנתונים הללו נכללו במודל הסופי. כאן אנחנו נוגעים קצת יותר בפרטים הטכניים, ואני לא רוצה ללכת לאיבוד, כי אני חושב שרבות מהביקורות של טורדוף וחבריה למחקר אינם מסתמכים על הבנה מתוחכמת במיוחד של סטטיסטיקה. מה שהנלי אומר כאן הוא שהמודל של החוקרים, שבשביל הגיקים שביניכם, הוא זה…

…נשען באופן משמעותי על התצפיות החד-פעמיות הללו. “זה, מבחינתי, חשוב מכיוון שלכל השוואה שהם עושים כעת חסרים כמה אנשים שאינם משתתפים יותר והם ויכולים רק לתרום לסטטיסטיקת הבסיס.” החוקרים לא מסבירים מדוע הם כוללים את הנתונים הללו במודל, אבל הנקודה של הנלי היא שישנה קבוצה של משתתפים נושרים מיד בין הסבב הראשון לשני וזה ברור לכל מי שמתבונן בטבלאות המקוונות מס’ 2 ו-3. יש 20 שנשרו מיידית מתוך במספר המשתתפים במחקר שהגיבו בכלל לסקר, ו-17 מתוך אלו שסיפקו תשובות על מדדי בריאות הנפש.

באופן כללי, הנלי תיאר את משוואות האומדן הכלליות במחקר כ”דרך גסה מאוד להתמודד עם [סוג זה של נתונים], דרך שהיא די נאיבית”. הטכניקה “נותנת להם אפשרות לעשות איזו השוואה שהם רוצים, ואז לדבר על שינוי – ובכן, זה שינוי, אבל הם לא מדברים על השינוי כמו שצריך.”

הבעיה עם דיכוטומיזציה משתנה

סוגיית הדיכוטומיזציה שהנלי הזכיר היא חשובה ביותר.

כפי שציינתי לעיל, המחקר של טורדוף ושות’ סובל מהעדר מוזר של מידע סטטיסטי קונקרטי. בואו נתמקד בכלי העיקרי בו השתמשו החוקרים לאמוד דיכאון ואובדנות, מה שנקרא שאלון בריאות המטופל בעל 9 פריטים, או PHQ-9, המורכב מתשעה נושאים בתוספת נושא אחרון שאינו נכלל בציון  אשר ממולא באופן הבא (או זמין כאן):

הציון הנמוך ביותר האפשרי הוא אפס (0X9), והציון הגבוה ביותר האפשרי הוא 27 (3X9). במקום לדווח על הערכים הממוצעים שדיווחו המשתתפים במחקר, החוקרים עשו דיטוכומיזציה למשתנים האלה – הם הפכו אותם למשתנה שיש לו רק שני ערכים, כן או לא (או 1 או 0, אם תרצו). ציון 10 ומעלה נחשב ל”כן”, כלומר יש לך “דיכאון בינוני או חמור”. נמוך מ-1 נחשב ל-“לא”, כלומר אין לך “דיכאון בינוני או חמור”. החוקרים גם דיכוטומיים בנוגע לאובדנות, הנכללת בפריט התשיעי – האם הנשאל חווה “מחשבות שעדיף שתמות, או שתפגע בעצמך” ואשר זוכה לניקוד מ-0 עד 3 על סמך התדירות שבה הנשאלים דיווחו שהרגישו כך בשבועיים האחרונים. אם הם מקבלים 1, 2 או 3, הם נחשבים כבעלי פגיעה עצמית או רעיונות אובדניים; אם הם מקבלים 0, הם לא. 

כך הולך לאיבוד הרבה מידע שימושי. לדוגמה, במחקר של טורדוף ושות’ מישהו שזוכה לציון 27 ב-PHQ-9 – רמת מצוקה כמעט בלתי נתפסת – נתפס כבעל אותו מצב בריאותי נפשי כמו מישהו שקיבל ציון 10. אם קוראים את הפריטים לעיל, קל לדמיין שמישהו מי שמקבל ציון 10 מתקשה מעט, אבל הוא עדיין די מתפקד. לא כך עבור אנשים בטווחים הגבוהים יותר. רוב ציוני ה-PHQ-9 במחקר זה, נחשבים כמבשרים על דיכאון.

החוקרים אינם מדווחים על בריאותם הנפשית של המשתתפים באופן זהיר ומפורט, מלבד טבלה אחת המספקת פירוט של אחוז המשתתפים בכל תיבה של – מינימלי, קל, בינוני, בינוני עד חמור וחמור בעת תחילת המעקב (שכולל, כזכור, 17 קריאות של ילדים שנשרו מהמעקב, כך שלא ברור מה עלינו לעשות איתם). לא ניתן אפילו למצוא את הציון הממוצע של PHQ-9 בראשית המעקב בשום מקום בכתב העת או בחומרים הנלווים, שלא לדבר על הציונים בגלים שונים של איסוף נתונים, או בחלוקה לפי טיפול רפואי מאשרר/ללא טיפול רפואי מאשרר. יחסי הסיכויים המדווחים מתייחסים פשוט להסתברות שמישהו במחקר יקבל 10 ומעלה בציון הכללי, 1 ומעלה בשאלת ההתאבדות, או 10 ומעלה בסולם החרדה (אני בעיקר מתעלם מהקטגוריה הזו משום שהחוקרים מדווחים על ממצא ריק שם, בכל מקרה). השוו חוסר זה בנתונים בסיסיים לאופן שבו קבוצה של חוקרים הולנדים דיווחה על ממצאיה במחקר חשוב משנת 2014 על מעבר רפואי לנוער. במאמר זה, המחברים סיפקו מידע ברור על ציוני התוצאה הממוצעים בכל גל של איסוף נתונים. אין שום תעלומה לגבי מה בדיוק מתארים המספרים. 

יש הרבה חסרונות לגישה הפשטנית לסטטיסטיקה ולחוסר השקיפות במאמר. לדוגמה, לפי שיטת המחקר, ילד שקיבל ציון 24 ב-PHQ-9 בקו הבסיס ו-15 שלושה חודשים לאחר מכן לא השתפר כלל – הוא “סובל מדיכאון בינוני או חמור” בשני הגלים – בעוד שילד אשר קיבל ציון 10 בנקודת ההתחלה ו-9 שלושה חודשים לאחר מכן יצא מקטגוריית ה”דיכאון בינוני או חמור” ל”לא דיכאון בינוני או חמור”. ירידה של נקודה אחת יכולה להיות הרבה יותר חשובה מירידה של תשע נקודות. זו פרסומת נחמדה לגבולות הדיכוטומיות המשתנה.

מה שבטוח, לפעמים משתנים דיכוטומיים שימושיים. בכל מקום ברפואה צריך לקבוע קו גבול פשוט כדי לקבוע, או לעזור לקבוע, למי “רשמית” יש מצב רפואי, מי זכאי לטיפול וכו’. אבל לפרסם מאמר שלם המבוסס בחלקו על סולם של 27 נקודות ולא להציע תובנות לגבי תוצאות הקבוצה שקיבלה טיפול מול קבוצת הביקורת, מלבד האם הם קיבלו ציון 10 או יותר בסולם הזה – אני באמת חושב שזה מרמז על כך שהחוקרים מסתירים משהו, שהם הריצו ניתוחים אחרים, לא מצאו את מה שהם רצו למצוא, ואז בחרו בשיטה מאוד גסה (אם נשתמש בשם התואר שנתן הנלי) שאפשרה להם “להראות” שטיפול שהם מעדיפים “עובד”. 

רמז פוטנציאלי אחד לכך עשוי להיות המקרה הוא שבשום שלב הכותבים לא מראים שהם בדקו אם הממצאים שלהם עמידים בפני ספים שונים. כפי שהם מציינים, לסולם 27 הנקודות של ה-PHQ-9 יש נקודות חיתוך אחרות, כמו 15 (חמורה-בינונית) ו-20 (חמורה). אם מתכוונים לדבוק אך ורק באמצעים דיכוטומיים, למה לפחות לא לדווח מה קורה כשמיישמים את החתכים השונים האלה על אותו דגם? אני בטוח שהתשובה היא שבדרך כלל, הם לא קיבלו כלום – שום הוכחה שקבוצת הטיפול המאשרר הצליחה יותר מהקבוצה שלא קיבלה טיפול מאשרר. 

בהחלט יתכן שאני לא נותן להם מספיק קרדיט כאן. הרבה מזה יהיה קל לבדוק אם החוקרים יספקו את הנתונים. אבל בגלל שהם לא, ובגלל שהם אפילו לא סיכמו את זה בשום מקום, אנחנו נאלצים לנחש למה הם עשו את הבחירות שהם עשו.

אחד החוקרים מגיב

סביר להניח שלעולם לא נדע בוודאות, אבל הייתי מהמר שההבדלים בבריאות הנפש שנצפו בין הקבוצות שקיבלו טיפול ואלו שלא נגרמו בעיקר מגורמים אחרים מלבד קבלת חוסמי התבגרות והורמונים. אני מבסס את התיאוריה הזו על העובדה שהקבוצות נראות שונות למדי, בהתחשב בהבדל העצום בשיעורי הנשירה שלהן. בנוסף, למדגם כולו נלקחו נתונים במרפאת מגדר, כלומר לגבי הקטינים, הוריהם הסכימו להביא אותם לשם ולבצע הערכה. הם היו במצב די טוב לקבל חוסמי גיל ההתבגרות או הורמונים אם הם רוצים אותם ואם הרופאים הסכימו שזה הצעד הנכון.

מישהו העלה טיעונים דומים במערכת התגובות המקוונת באתר JAMA, וטורדוף הגיבה (לחצו על “תגובות” אם הקישור הזה לא עובד). ראשית, היא כותבת שבמרפאת המגדר לילדים בסיאטל, ילדים שרצו לקבל טיפול תרופתי (ושהיה להם אישור הורים אם הם קטינים) הוכנסו אליו בדרך כלל ללא קשר למצב הבריאות הנפשי שלהם:

בפועל, המקרים היחידים שבהם הייתה סיבה לעכב את התחלת מתן הבלוקרים/הורמונים הם אם היה חשש שלמטופל אין יכולת לספק הסכמה מדעת (דבר נדיר ביותר בגיל ההתבגרות). לכן, מבני נוער שדיווחו על דיכאון בינוני עד חמור, חרדה או מחשבות אובדניות לא נמנע טיפול תרופתי, במיוחד מכיוון שידוע שהתחלת טיפול תרופתי משפרת או מפחיתה את התסמינים הללו.

אלו הן נקודות משיקות במקצת, אבל מעניין שטורדוף טוענת ש”התחלת מתן בלוקרים/הורמונים ידועה כמשפרת או מפחיתה את התסמינים הללו”, כאשר כל מטרת המחקר שלה הייתה לחקור את השאלה הזו, וכאשר היא והצוות שלה גילו כי אלה תרופות לא עשו את זה. אני גם באמת סקרן איזה אחוז מהרופאים המגדריים לנוער יסכימו איתה שזה “נדיר ביותר” שמתבגר לא יכול לספק הסכמה מדעת משמעותית לטיפול תרופתי – הרבה מאלה שדיברתי איתם אמרו שהנושא עולה בתדירות מסוימת, במיוחד במקרים הכרוכים במחלות נפש חמורות. (טורדוף מפרשת מעט שלא כהלכה את ההנחיות החדשות של האגודה המקצועית העולמית לבריאות טרנסג’נדרים במקום אחר בהערה שלה, לדעתי, אבל אני אדחה את הנקודה הזו להערת שוליים 5.)

כך או כך, טורדוף אומרת שהמרפאה בדרך כלל לא ראתה דיכאון חמור או התאבדות כסיבה לעכב את מתן ההורמונים. בנוסף, היא אמרה, “יש לנו ראיות אמפיריות שלא היו הבדלים משמעותיים במרשם של בלוקרים והורמונים לפי בריאות הנפש הבסיסית”:

ראינו ששיעור דומה של בני נוער עם תסמינים של בריאות נפשית לקויה בתחילת הדרך קיבלו בלוקרים והורמונים במהלך המעקב בהשוואה לנוער שלא דיווחו על תסמינים אלו. באופן ספציפי, לא היו הבדלים משמעותיים בקבלת PB/GAH במהלך תקופת המעקב של המחקר שלנו בקרב בני נוער עם וללא דיכאון בינוני עד חמור (64% לעומת 76%, ערך p = 0.234); עם ובלי חרדה בינונית עד קשה (67% לעומת 71%, ערך p = 0.703); ועם ובלי פגיעה עצמית או מחשבות אובדניות (62% לעומת 75%, ערך p = 0.185) בקו הבסיס. למרות שראינו שבני נוער עם בריאות נפשית לקויה בתחילת המחקר היו בסבירות נמוכה יותר לקבל מרשם לבלוקרים והורמונים במהלך המחקר שלנו, ההבדלים הללו היו קטנים בגודלם (4-13 אחוז) ולא היו מובהקים סטטיסטית.

החוקר שרצה להישאר שלא לייחוס אמר גם שלבני נוער עם ובלי בעיות נפשיות היה “שימור דומה במחקר”, כלומר שיעורי השחיקה הדיפרנציאליים לא צריכים להדאיג במיוחד, אם כי הם לא סיפקו כל מידע המגבה טענה זו. בהנחה שכל זה נכון – שהמרפאה אכן נותנת חוסמים והורמונים ללא התחשבות במצב הנפשי של מטופליה, ושלא היו הבדלים משמעותיים בשיעורי השחיקה – זה לפחות יפגע בטענתי שבעיות נפשיות עלולות לגרום לחוסר גישה לטיפול הורמונלי במחקר זה, ולא להיפך.

הבעיה היא שהחוקרים לא מציעים נתונים במחקר שלהם או בחומר הנלווה לו שמראים איזו הוכחה לטענה זו – והנתונים הבלתי פורמליים של טורדוף מצביעים על הכיוון שהיינו מצפים לו אם התיאוריה שלי הייתה נכונה, שלילדים יותר חולי נפש יש פחות סיכוי ללכת לטיפול ! ההבדלים שהיא מצטטת אינם זעירים בשום אופן – 12 אחוז עבור דיכאון ו-13 אחוז עבור פגיעה עצמית או מחשבות אובדניות (השיעור הקטן היותר, 4 אחוז, מתייחס לחרדה, שם החוקרים לא טוענים שגילו שום דבר). 

טורדוף מציינת שההבדלים האלה אינם מובהקים סטטיסטית, וזה נכון, אבל כל מה שזה אומר הוא שהם מעל לסף p < .05 השרירותי. השפעה לא מובהקת סטטיסטית לא אומר שאין השפעה – אלא, זה אומר שאי אפשר לשלול סופית את האפשרות שכל הבדל לכאורה הוא תוצאה של מקרה אקראי. במקרה זה, הגדרת ספר הלימוד של ערך p צריכה לגרום לנו להסיק שיש סיכוי של כ-23% שנבחין בהבדל של לפחות עד 12 אחוז בשיעורי הדיכאון בין ילדים שקיבלו הורמונים ובין אלו שלא, וסיכוי של כ-19% שנראה הבדל של לפחות עד 13 אחוז בין שיעורי האובדנות של הילדים שקיבלו הורמונים ובין אלו שלא, אם לא היו קשרים אמיתיים בין המשתנים הללו. אז זה בשום אופן לא מפריך את התיאוריה של הבדלים רציניים, בלתי ניתנים להסבר, בין שתי הקבוצות.

גם אם נאמץ כאן עמדה נדיבה ביותר כלפי הטיעון של טורדוף ונניח שאין בנתונים שלה ראיות לקשר בין מצב בריאות הנפש והאם מטופל קיבל טיפול תרופתי או לא, זכרו שהיא ועמיתיה משתמשים במדדים גסים מאוד של כן/לא כדי למדוד דיכאון ואובדנות – עבור שני המדדים, מרבית הנקודות בסולם הנדון מסומנות כ”כן” ולא “לא” (באופן ספציפי, ציונים מ-10 עד 27 מתייחסים כאל כן בסולם הדיכאון מ-0 עד 27 , ולציונים מ-1 עד 3 מתייחסים כאל כן לגבי שאלת האובדנות בסולם מ-0 ל-3). אז גם אם זה נכון שהחוקרים לא ראו הבדל מובהק סטטיסטית באחוז של שתי קבוצות שהגיעו לסף ה”דיכאון מתון”, זה לא אומר שלא היו הבדלים משמעותיים בין הקבוצות הללו. למעשה, כמעט כל בחירה מתודולוגית של החוקרים מטשטשת כל הבדלים שכן קיימים.

כדי להבהיר את הנקודה, בואו נדמיין תרחיש קיצוני בכוונה הכולל רק שני ילדים שונים מאוד במחקר, שניהם נקבות מלידה:

ילדה א’, בת 12, מקבלת ציון 10 ב-PHQ-9. אין לה דיספוריה מגדרית, והיא נגררה למרפאה כי יש לה הורים שמרניים מבחינה חברתית שאינם מרוצים שהיא קיצצה את שערה ורוצה ללבוש ג’ינס “של בנים”. הוריה, לאחר שנאמר להם שאין שום דבר “לא בסדר” עם הילדה שלהם מלבד דיכאון (בקושי “מתון”) – שאולי הוחמר על ידי ניסיונות הוריה להפעיל כל כך הרבה שליטה על הלבוש ובחירותיה האופנתיות – לא מחזירים אותה ל מרפאת המגדר.

ילדה ב’, גם היא בת 12, מקבלת ציון 22 ב-PHQ-9, סובלת מדיספוריה מגדרית קשה ומשתקת וכבר עברה מעבר חברתי – היא ילד טרנס. הוא מקבל במהירות אבחנה “רשמית” של דיספוריה מגדרית והתחיל להשתמש בחוסמי גיל ההתבגרות, והוא והוריו נשארים בקשר עם המרפאה בשלושת גלי איסוף הנתונים הבאים.

לפי השיטות של החוקרים עצמם, שני הילדים האלה ייראו כבעלי רמות “דומות” של דיכאון, והדיאדה הזו תתרום למסקנה שלא היו הבדלים משמעותיים בין ילדים שקיבלו הורמונים או חסמים ובין אלו שלא, ובין מי שנשר ומי שלא! אבל כמובן שמדובר במצבים שונים בתכלית, וכמובן שיש כאן הרבה הבדלים שמסתירים על ידי דגם מלא ב”כן” ו”לא”, ב-1 ו-0.

שוב, אני מעלה ספקולציות. אבל הנקודה שלי היא שאם שיטת המחקר לא יכולה אפילו להבדיל בין שני הילדים האלה בתרחיש היפותטי, קיצוני בכוונה, כמובן יתכן שהבדלים אחרים, פחות עמוקים, נעלמים מעיני החוקרים. לילדים בדיכאון בינוני לפחות במחקר יש סיכוי נמוך ב-12 אחוז לקבל טיפול רפואי בהשוואה לילדים שלא עומדים ברף הזה. מה הגודל של ההבדל הזה אם נעלה את הסף הזה בכמה נקודות PHQ-9? יותר לעניין, מה ההבדל בציוני ה-PHQ-9 הממוצעים של שתי הקבוצות הללו? זו שאלה סבירה בהחלט שכל אחד צריך להיות מסוגל לענות עליה פשוט על ידי קריאת כתב העת עצמו. “האם שתי הקבוצות שאנו משווים באמת דומות?” היא שאלה ברמת השבועיים הראשונים של מבוא לסטטיסטיקה. ובכל זאת התשובה לא נמצאת בשום מקום במאמר הזה – היא חסרה, כמו כל כך הרבה מידע בסיסי אחר6.

חלק מהבעיה הוא שאפילו כלי תקשורת איכותיים לא בודקים מחקרים כמו זה

כבר כתבתי על העבודה האיומה שעושה התקשורת המיינסטרים בסיקור רפואת מגדר לנוער ואני לא רוצה פשוט לדקלם את הנקודות הללו שוב, אבל זה סימן רע מאוד שהמחקר הזה הוצג בתכנית “יום שישי במדע” באופן הזה:

[מארח] IRA FLATOW: דיאנה, האם את יכולה להסביר לי מה מצאת במחקר הזה על ילדים ובני נוער טרנסים ולא בינאריים? 

דיאנה טורדוף: בהחלט. תודה שהיית כאן היום. המחקר שלנו נערך במרפאת המגדר של בית החולים לילדים בסיאטל. והמטרה שלנו הייתה לעקוב באופן פוטנציאלי אחר בני נוער במהלך שנת הטיפול הראשונה שלהם כדי להבין טוב יותר את החוויות שלהם, את רווחתם, כמו גם את החסמים שהם התמודדו איתם בגישה לטיפול. אז רשמנו 104 צעירים טרנסים, בגילאי 13 עד 20. ומצאנו שבני נוער שקיבלו חוסמי גיל ההתבגרות או הורמונים המאשרים את המגדר היו בסיכון נמוך ב-60% לדיכאון ו-73% פחות ללקות במחשבות אובדניות, בהשוואה לבני נוער אשר לא קיבל את התרופות הללו. 

IRA FLATOW: זה הבדל עצום. 

דיאנה טורדוף: זה ענק.

IRA FLATOW: ואיגודים רפואיים גדולים תומכים בטיפול המאשר את המגדר, נכון?

דיאנה טורדוף: בהחלט. תרופות אלו הן בטוחות. והשימוש בהם אצל מתבגרים נתמך על ידי מספר רב של אגודות רפואיות ומקצועיות, כולל האקדמיה האמריקאית לרפואת ילדים והאיגוד הרפואי האמריקאי.

זהו זה. המחקר מצא “הבדל עצום”. אין שאלות המשך, כמו מדוע הילדים שהלכו על חוסמים והורמונים בדגימה של טורדוף לא השתפרו. לא אתפלא אם יתברר שאף אחד ב-Science Friday אפילו לא קרא את המחקר במלואו.

טורדוף גם מתאר חוסמים והורמונים לנוער כ”בטוחים”, ללא כל פרטים נוספים. זוהי הגזמה לגבי מצב הידע הנוכחי שלנו בתחום זה. “יש לשקול כל יתרונות פוטנציאליים של הורמונים המאשרים את המגדר מול פרופיל הבטיחות לטווח ארוך שלא ידוע ברובו של טיפולים אלה בילדים ובמתבגרים עם דיספוריה מגדרית”, אמר המכון הלאומי למצוינות בבריאות וטיפול בבריטניה בשנת 2020, לצד דו”ח נלווה על חוסמי גיל ההתבגרות שמצא עדויות לא איכותיות גם לבטיחותם וליעילותם. Cass Review, עוד מאמץ חשוב בבריטניה שנועד לסכם את הנתונים ולכוון את המהלך העתידי של טיפול מגדרי לנוער שם, שמסקנות הביניים שלו פורסמו רק לפני כמה שבועות, ציין כי “השאלה החשובה כעת, כמו בכל טיפול, האם הראיות לשימוש ובטיחות התרופה חזקות מספיק לפי סטנדרטים קליניים סבירים”. כמו בעניין, זו עדיין שאלה פתוחה. הדו”ח מציין גם כי “הפחתה לטווח קצר בצפיפות העצם היא תופעת לוואי מוכרת היטב [של חוסמי גיל ההתבגרות], אך הנתונים חלשים ואינם חד משמעיים לגבי ההשפעה ארוכת הטווח של השרירים והשלד.”

בשוודיה ובפינלנד, רשויות הבריאות מודאגות מספיק מהיעדר ראיות לכך שבטוח ויעיל לתת חוסמי גיל ההתבגרות והורמונים לקטינים דיספוריים מגדרית, כך שהם הפחיתו משמעותית את מתן הטיפולים הללו. על פי תרגום לא רשמי של ההנחיות החדשות של פינלנד, שהוכרזו בשנת 2020, “ניתן להתחיל טיפול דיכוי גיל ההתבגרות על בסיס כל מקרה לגופו לאחר שיקול זהיר ובדיקות אבחון מתאימות אם קיימות התוויות רפואיות לטיפול ואין התוויות נגד. .” כאשר שבדיה הלכה בעקבותיה, והנהיגה הגבלות חדשות משלה רק לפני חודש וחצי, מועצת הבריאות והרווחה הלאומית שלה ציינה כי “אין מסקנות ברורות לגבי ההשפעה והבטיחות של הטיפולים”, לפי Google Translate. המהלך של שוודיה נוצר בחלקו עקב שערורייה מדאיגה לכאורה – סרט תיעודי בטלוויזיה ציבורית ובו נטען שנראה כי רופאים ומנהלים בבית חולים גדול שם מחפים על תופעות לוואי חמורות, כולל פגיעה בעמוד השדרה ואובדנות, בקרב ילדים שעברו את הטיפולים הללו (ראיינתי את המגיש הראשי כאן אבל זה נגיש רק למנויים בתשלום).

אין שום אזכור לכל זה בעיתון JAMA Network Open, וגם לא בסיקור של התכנית “יום שישי במדע” – אפשר לחשוב שאין כאן שום ויכוח, שהמדע איתן בדעתו, כשלמעשה המחלוקת התלהטה כל כך, שמערכות הבריאות הגדולות באירופה שינו את המדיניות שלהן לגבי טיפולים אלו. אולי הם טועים שעשו זאת, אבל זה די מפתיע לראות תכנית כמו Science Friday מתעלמת לחלוטין מכל זה, ולראות רופאים כל כך לא מעוניינים בשערורייה וכל כך מוכנים להעלים סימני אזהרה בנתונים שלהם.

באופן דומה זה מפתיע ש-JAMA Network Open מאפשרת לחוקרים לטעון שטיפול נמצא בקורלציה עם שיפור לאורך זמן בבריאות הנפשית של קבוצת צעירים כשלא כך הוא. פניתי לאיש הקשר התקשורתי שם, כמו גם לשני העורכים הראשיים של כתב העת, פרדריק ריבארה וסטפן פיהן, שניהם באוניברסיטת וושינגטון-סיאטל, אבל לא זכיתי לתגובה.

אני חושב שהסביבה הפוליטית מחריפה את הדברים, לצערי. ברמת המדינה, הרפובליקנים מציעים מדיניות רעה ומזיקה באמת. בטקסס, מה שגרג אבוט וקן פקסטון מנסים לעשות ניתן לתאר רק כחטיפת ילדים באישור המדינה. זה מחריד. אז חלק ממה שקורה הוא שיש מירוץ להוכיח עד כמה הפוליטיקאים האלה טועים, ולהפיק ראיות המראות שהטיפולים עובדים. כפי שניסחו זאת טורדוף ועמיתיה בסוף מאמרם, “לממצאים שלנו יש השלכות מדיניות חשובות, מה שמצביע על כך שלגל החקיקה האחרון המגביל את הגישה לטיפול המאשר מגדר עשויות להיות השלכות שליליות משמעותיות על רווחתם של צעירים טרנסים ולא בינאריים. ” זהו, שוב, מאמר שמצא שילדים שנטלו חוסמים והורמונים לא השתפרו. המדע הפך להיות שזור לחלוטין בפוליטיקה.

אבל השאלה אם המפלגה הרפובליקנית ירדה מהפסים בנושא הזה (לגמרי) והאם המדיניות שלה תפגע בילדים שצריכים לקבל חסמים ו/או הורמונים (לגמרי) שונה מהשאלה אם עלינו לשמור על ערנות ולהתריע מפני מדע חצי אפוי בכל הנוגע לספרות על רפואת מגדר לנוער (שוב: בהחלט). בריאות הנפש של מתבגרים וחקר התאבדות בפרט, הם תחום חיוני ביותר במדע, ועלינו לעמוד בו בסטנדרטים גבוהים. אם אנחנו לא יכולים להסכים שעיוות מחקר בנושא זה הוא לא נאות ועלול להזיק, על מה אנחנו כן יכולים להסכים?


הערות שוליים:

1.

אני מניח שטכנית עם חוסמי גיל ההתבגרות, “זה מסובך.” יש הרבה ויכוחים סוערים על הטענה שהם ניתנים כדי “לקנות זמן” לילד ולמשפחתו כדי להבין אם הורמונים הם הבחירה הנכונה. אם זה המקרה, אני לא חושב שבריאות נפשית יציבה, במקום בריאות נפשית משופרת, תהיה בהכרח פגיעה בהם. אבל אם זה נכון, אף אחד לא צריך לטעון שחוסמים משפרים אובדנות, מה שהרבה אנשים עושים. בכל מקרה, זה סוג של אי-הפסקה במקרה של המחקר הזה, שכן, לפי טבלה 1, כל כך הרבה יותר מהילדים קיבלו הורמונים (61.5%) מאשר חוסמים (18.2%), כלומר המחקר משמש כהערכה של הראשון הרבה יותר מהשני.

2.

נניח שרוצים לבדוק תרופה חדשה לשפעת. מוצאים 50 חולים עם שפעת ומזמינים אותם למרפאה. שם מקבלים מידע בסיסי על הסימפטומים שלהם, נותנים להם את כל התרופות, ואז בודקים שוב שבוע לאחר מכן. הפלא ופלא – בממוצע, הם השתפרו משמעותית! למרבה הצער, זה באמת רק הצעד הראשון להוכחה שטיפול רפואי עובד. זה הכרחי אבל לא מספיק. יכולות להיות סיבות אחרות לכך שהמטופלים השתפרו. תסמיני שפעת לרוב חולפים מעצמם עם הזמן, ראשית. מצד שני, השפעות פלצבו יכולות להיות עוצמתיות: ככל שזה נשמע מוזר, אין זה מן הנמנע שעצם הפגישה עם הרופא מפעילה השפעה מסתורית שמשפרת את בריאותם של המטופלים. כדי להסביר את האפשרויות האחרות הללו – שלא התרופה, או לא רק התרופה, גרמה לשיפור – צריך קבוצת ביקורת. הסטנדרט של מערך ניסוי כזה תהיה למצוא 100 אנשים עם שפעת, ואז לחלק אותם באופן אקראי לשתי קבוצות של 50, כל אחת מהן חולה באותה מידה, בממוצע. מטפלים בהם באופן זהה עם ביקור במרפאה, מדידת סימפטומים וכן הלאה, וההבדל היחיד הוא שמחציתם מקבלים את הטיפול האמיתי ומחציתם מקבלים כדור סוכר או טיפול מדומה אחר שלא היינו מצפים שתהיה לו השפעה על שפעת. אם לאחר ביצוע הליך זה מוצאים הבדל מובהק סטטיסטית בתסמיני השפעת בין קבוצות הטיפול והדמה, אזי זהו צעד גדול להוכחת יעילות הטיפול. אמנם שיפור כשלעצמו לא מספיק, לפחות לא ביחד לסטנדרט המקובל. אבל אם אפילו לא מזהים שיפור, זו בעיה גדולה!

3.

מאיפה אני מביא את המספרים האלה: הרוב המכריע של הילדים שנשרו מהמחקר הזה לא קיבלו טיפול רפואי מאשש מגדר. בסוף המחקר, רק 6/63 מהילדים הנותרים שסיפקו נתונים על בריאות הנפש, או 9.5% ממשתתפי המחקר, היו בקבוצה ללא טיפול רפואי מאשש מגדר. בסך הכל, על פי נתוני החוקרים, 12/69 (17.4%) מהילדים שטופלו עזבו את המחקר, בעוד ש-28/35 (80%) מהילדים שלא טופלו עזבו אותו.

לפי הסדר:

6: eTable 3, 12 חודשים / ללא

63: = 6 + 57, eTable 3, 12 חודשים / PB/GAH + None

12: = 69 – 57, ראה להלן עבור 69 ו-57 הוא מ-eTable 2, 12 חודשים / PB/GAH

69: – עמוד 1, “עד סוף המחקר, 69 בני נוער (66.3%) קיבלו PBs, GAHs או שתי ההתערבויות”

28: = 35 – 7, ראה להלן עבור 35 ו-7 הם מ-eTable 2, 12 חודשים / אין

35: עמוד 1, “בעוד 35 בני נוער לא קיבלו אף התערבות”

4.

במקור שמתי כאן “עדכון” די בהול כי הצלחתי לשכנע את עצמי שיש טעות אפשרית בניתוח שיעורי הנשירה שלי . התברר שזו אזעקת שווא – המספרים שלי נכונים. לא רציתי להשאיר עדכון ארוך בפסקה לגבי מה שהתברר כמשהו חסר משמעות בגוף המאמר, אז אדביק אותו למטה למען השקיפות, ואחריו רק קצת יותר פרטים על המספרים בסעיף זה ובהערת שוליים 3 לאובססיבים האמיתיים.

השפה המקורית של העדכון:

(עדכון, ערב ה-6 באפריל 2022: כמה אנשים ציינו שייתכן שאני מעריך יתר על המידה את גודל ההבדל הזה בכך שלא התחשבתי בילדים שעוזבים את הקבוצה שלא קיבלה טיפול רפואי לא בגלל שהם נושרים אלא בגלל שהם עברו לקבוצת הטיפול הרפואי. ביליתי עוד כמה שעות היום אחה"צ ובערב בלדפוק את הראש שלי ב-eTable3 ללא הועיל  - מכיוון שהחוקרים מספקים כל כך מעט נתונים קונקרטיים, שקשה מאוד להבין בדיוק מה קורה לגבי מי עוזב לעומת מי עבר לקבוצה השנייה. אני מבקש מעוד כמה אנשים לבדוק את המסקנות שלי וברגע שאחזור אליהם, אם יהיה צורך אעדכן או תקן את הנתונים בפסקה זו ובהערת השוליים. משהו מאוד מוזר צריך להיות בנתונים כדי שזה ישפיע באופן מהותי על הטיעון שלי לגבי שיעורי שחיקה דיפרנציאליים - בעצם, זה צריך להיות כך שמספר מפתיע של ילדים עברו מהקבוצה שלא קיבלה טיפול רפואי לזו שקיבלה טיפול בין 6 חודשים ל-12 חודשים, ושמספר גדול של ילדים שכבר קיבלו חוסמים או הורמונים נשרו מהמחקר במהלך אותו פרק. אני חושב שהבדל גדול בשיעור הנשירה הוא הסבר הרבה יותר סביר, אבל, שוב, אחזור לכך כשאבדוק את זה בצורה יסודית יותר. רק רציתי לפרסם עדכון ראשוני למען השקיפות.)

אני לא בטוח איך הצלחתי לשכנע את עצמי שמשהו קורה כאן. חישוב שיעורי השחיקה השונים הוא די קל. בהערת השוליים הקודמת, השתמשתי רק ב-eTable 2, במיוחד בנתונים של 12 חודשים…

…בתוספת שפה זו מגוף המאמר: “עד סוף המחקר, 69 בני נוער (66.3%) קיבלו PBs או GAHs… בעוד 35 בני נוער לא קיבלו PBs או GAHs (33.7%) (eTable 3 במוסף).

בגל הסופי של הנתונים, אנחנו לא באמת צריכים לדאוג מי החליף קבוצה לעומת מי נשר, כי אנחנו נשארים עם חישוב פשוט. המספר הכולל של הילדים שקיבלו טיפול רפואי – הילדים שעדיין במחקר בתום 12 חודשים פלוס אלה שנשרו – צריך להסתכם ב-69. המספר של הילדים שעדיין במחקר הוא 57, אז יש 12 נושרים. באופן דומה, המספר הכולל של הילדים שלא קיבלו טיפול תרופתי – הילדים שעדיין במחקר בגיל 12 חודשים פלוס אלה שנשרו – צריך להסתכם ב-35. המספר שעדיין במחקר הוא 7, אז יש 28 נושרים. אלו המספרים שהצגתי במקור ואין לי מושג איך הצלחתי להתחרפן בגלל זה.

5

טורדוף כותבת על מדיניות המרפאה של מתן חוסמי גיל ההתבגרות והורמונים אפילו לילדים אובדניים ודיכאוניים חמורים, מכיוון שזה “נדיר ביותר” שמצבים אלו מהווים מכשולים עיקריים בפני קטין לתת הסכמה מדעת אמיתית:

שיטות עבודה אלו תואמות הנחיות מעודכנות מאת טיוטת ההנחיות של WPATH SOC8, הקובעת כי עבור בני נוער החווים אובדנות חריפה, פגיעה עצמית או משברים אחרים בבריאות הנפש, "התערבויות הקשורות לבטיחות אינן מונעות התחלת טיפול המאשר מגדר" וכי "בזמן שהתייחסות לדאגות בריאות הנפש חשובה, זה לא אומר שכל בעיות בריאות הנפש יכולות או צריכות להיפתר לחלוטין[.]"

אני חושב שהיא בוחרת באופן סלקטיבי חלק מההנחיות, ומשמיטה את העובדה שה-SOC8 כולל הרבה אזהרות לגבי הצורך לוודא שבעיות בריאות הנפש מטופלות לפני מתן חוסמים או הורמונים. אני חוזר על הפסקה שציטטתי למעלה:

ראשית, כאשר מתבגר TGD [טרנסג'נדר או מגוון] חווה אובדנות חריפה, פגיעה עצמית, הפרעות אכילה או משברים אחרים בבריאות הנפש המאיימים על הבריאות הגופנית, יש לתת עדיפות לבטיחות. על פי ההקשר וההנחיות המקומיות, טיפול מתאים צריך לשאוף לצמצם איום או משבר כך שיהיה מספיק זמן ותושג התייצבות שתאפשר הערכה וקבלת החלטות מושכלות שקשורות למגדר. לדוגמה, מתבגר אובדני באופן פעיל עשוי שלא להיות מסוגל רגשית לקבל החלטה מושכלת לגבי [טיפולים אלו]. אם הדבר מצוין, התערבויות הקשורות לבטיחות אינן מונעות התחלת טיפול המאשר מגדר.

יש קצת הסתייגויות בפסקה, אבל אני לא יודע איך מישהו יכול היה לקרוא את זה ולחשוב שה-SOC8 חושב שאובדנות חמורה ודיכאון הם לא סיבות טובות לעצור קבלת החלטות רפואיות משמעותיות, בניגוד למה שטורדוף טוענת שקורה במרפאת המגדר לילדים בסיאטל. (אני תוהה אם המדיניות של המרפאה הייתה אולי שמרנית יותר ב-2017 וב-2018, כאשר קבוצת הילדים הזו הגיעה, אבל אנחנו כבר עמוק בתוך הערות שוליים ואין צורך לסטות עוד מהנושא…).

6

באחת מתגובותיה המקוונות, כותבת טורדוף כי “תכנון המחקר שלנו לא השווה בין שתי קבוצות… במקום זאת, בדקנו מגמות זמניות בתוך קבוצה אחת של נוער עם משתנה חשיפה משתנה בזמן”. אוקיי, אבל בסופו של יום, התוצאות שהם פרסמו התקבלו על ידי השוואת ההסתברות של קבוצה אחת לעומת קבוצה אחרת לחוות תוצאות שונות, אז אני לא חושב שיש משהו רע בלהתעקש לשאול האם שתי הקבוצות הללו היו דומות מספיק כדי שהשוואות כאלה יהיו משמעותיות.