אם תבחנו אותו מקרוב, תראו שהכותרות המנופחות אינן מוצדקות.
ג’סי סינגל, 7 בפברואר 2022. תרגום מאת נעמה עציץ
מקור: https://jessesingal.substack.com/p/the-new-highly-touted-study-on-hormones
אם עדיין לא קראתם את חלק 1 (הקישור הוא לתרגום כאן באתר), כדאי לכם לקרוא לפני שאתם קוראים את זה.
כפי שציינתי בפוסט ההוא, מוקדם יותר החודש פרסם המגזין The New England Journal of Medicine (NEJM) מחקר שחיכו לו זמן רב, בשם “תפקוד פסיכו-חברתי בנוער טרנסג’נדרי לאחר שנתיים של הורמונים”. צוות המחקר בילה שנים במעקב אחר קבוצה של ילדים שקיבלו חוסמי גיל התבגרות או הורמונים, בהשתתפות של ארבע מרפאות. במחקר זה, החוקרים דיווחו על מצב הילדים שקיבלו הורמונים במהלך השנתיים שעברו מתחילת התהליך. כל שישה חודשים המשתתפים מילאו סקרים בנושאים הקשורים לבריאותם הנפשית, דיספוריה מגדרית וכן הלאה. לדברי החוקרים, הילדים הראו שיפורים משמעותיים שנתיים לאחר מכן. “התוצאות שלנו מספקות בסיס מדעי חזק לכך שטיפול מאשרר מגדר הוא חיוני לרווחתם הפסיכולוגית של המטופלים שלנו”, אמר רוברט גארופלו, אחד החוקרים הראשיים של המחקר ומנהל שותף של מרפאת המגדר לנוער בבית החולים לילדים לוריא בשיקגו, בהודעה לעיתונות המלווה את המחקר, ומספר כלי תקשורת חזרו שוב ושוב על הנרטיב הזה.
אבל זו פרשנות מפוקפקת של התוצאות, בגלל מספר סיבות. בפוסט האחרון שלי הצבעתי על משהו חשוד במחקר: בפרוטוקול המחקר שלהם, כולל גרסה שהם הגישו למאגר רישום מראש, שיערו החוקרים שחברי קבוצה זו יחוו שיפור בשמונה מדדים, כולל כאלה המוכרים על ידי חוקרי מגדר נוער כמדדים חשובים, כגון דיספוריה מגדרית, אובדנות ופגיעה עצמית. לאחר מכן, במאמר שפורסם במגזין ה- NEJM, החוקרים שינו את השערתם ושישה מהמשתנים הללו לא נמצאו בשום מקום. שני הנותרים – חרדה ודיכאון – נעו בכיוון חיובי עבור טרנסים (נקבות ביולוגיות) אך לא עבור טרנסיות (זכרים ביולוגים). החוקרים דיווחו גם על שלושה משתנים אחרים מבלי להסביר כיצד הם בחרו אותם (שניים השתפרו עבור בנות ובנים טרנסים, ואחד רק עבור טרנסים-נקבות ביולוגית).
אני לא אחזור על כל הפוסט כאן, אבל לדעתי נושא המשתנים החסרים הזה מעמיד בספק את כל העבודה, פשוט כי אם רבים מהמשתנים שאחריהם עקבו החוקרים לא השתפרו, או אפילו החמירו, אז העובדה שהם היו יכולים לבחור חמישה שכן הראו שיפור מסוים – עשויה להיות חסרת משמעות לחלוטין. יכול להיות שאנחנו מסתכלים רק על רעש סטטיסטי, אבל אנחנו פשוט לא יכולים לדעת בוודאות מכיוון שהחוקרים מסתירים הרבה מאוד מהתוצאות שלהם.
עם זאת, עבור הפוסט הזה, בואו נשים בצד באופן זמני את הבעיה הרצינית הזו. במקום זאת, בואו נדמיין, שמחברי המחקר רשמו מראש שהם מעוניינים בחמשת המשתנים עליהם הם כן דיווחו לאורך הדרך, ואז נמשיך בהתאם ונבחן את הערכת המחקר שלהם. אני גם לא מתכוון להתפלפל בפוסט זה או אפילו לבחון לעומק את הטכניקות הסטטיסטיות הספציפיות בהן המחברים השתמשו. כפי שעוד תראו, גם אם נאשר כאן שהם קיבלו את ההחלטות הנכונות (מה שנכון או לא נכון) וניתן להתייחס לממצאים שלהם כקביעה נכונה – התוצאות, במקרה הטוב, עדיין מעורפלות.
קצת כחכוח גרון פוליטי לפני שנתחיל: אם תכתבו ביקורת על רפואה מגדרית לנוער, תשמעו מהרבה אנשים נזעמים על האיומים איתם מתמודדים טרנסים (מבוגרים וילדים) בארצות הברית. וכפי שציין דייב וייגל בכתבת שישי ב-Semafor, דונלד טראמפ בדיוק פרסם הצעה חדשה ומטורפת לצמצם דרסטית הן את זכויות הטרנסג’נדרים למבוגרים והן את הגישה לרפואת מגדר לנוער לילדים ובני נוער.
אולי אני חוזר על עצמי, אך אני מתנגד לסוגי המדיניות שמציע טראמפ, הן להגבלות המוחלטות על רפואת מגדר לנוער והן להצעתו העוד יותר קיצונית להכניס לחוקים הפדרלים איסור אפילו על מבוגרים לשנות את המין החוקי שלהם. החלק האחרון בפרט הוא אכזרי וחסר טעם לחלוטין, בנוסף להיותו פיתיון עבור הבוחרים האוונגליסטים שהוא מקווה לקבל את קולותיהם ב-2024. (עמדותיו של טראמפ בנושאים אלה משתנות, לפעמים בצורה צורמת, בהתאם לרוחות הפוליטיות. וייגל כותב כי “ב-2016 הוא הנחה מסיבה פומבית של מפלגה תומכת להט”ב, התנגד לנושא השימוש בשירותים בנוגע לטרנסג’נדרים בצפון קרוליינה והזמין את קייטלין ג’נר להשתמש בכל המתקנים שהוא רוצה בנכסי טראמפ”.
אבל כפי שציין וייגל בכתבה שלו, יש הבדל ראוי לציון בין מה שטראמפ מציע לבין וויכוחי המיינסטרים המהותיים יותר המתחוללים כיום בנוגע למעבר רפואי בנוער. בסופו של יום, לאור הפופולריות הגוברת של טיפולים אלה וההכרזות הבוטות של התומכים בהם, השאלות הנוגעות לרפואת מגדר לנוער זקוקות בדחיפות לתשובות, ללא קשר מיהו הנשיא או אילו איומים יש על קהילת הלהט”ב. הטיעון ש”זה לא הזמן לדון בזה”, הוא טקטיקה ירודה. וזה טיעון שלמען האמת נתקלתי בו הרבה לפני שהרפובליקנים התעסקו בנושא הזה. אם נחכה עד שלא יהיו עוד זועמים המנסים להרוויח כתוצאה מהפחד מטרנסג’נדרים, לפני שנבין בדיוק אם ובאיזו מידה רפואת מגדר לנוער עובדת (נושא שעל פי כל הסטנדרטים הקיימים של ראיות רפואיות נותר לא פתור) – אנו נמשיך לפעול כעיוורים.
זה כל מה שאני הולך להגיד על זה: אני כתב מדע יותר מאשר מומחה, ואם אתפלפל על כל פסקה בסוגריים לגבי מדיניות טראמפיסטית – המאמר יהפוך במהירות לבלתי קריא. בנוסף, אמונותיו של המחבר לא באמת משנות את מה שנכון או לא נכון כשלעצמו.
שיהיה ברור, המחקר שפורסם במגזין New England Journal of Medicine הוא שיפור משמעותי ביחס למה שנחשב כמחקר ראוי בתחום רפואת המגדר לנוער (הרף נמוך). זה מצוין שחוקרים עוקבים מקרוב אחר קבוצות של ילדים המקבלים בלוקרים והורמונים, ואוספים נתונים מגוונים על מצב הבריאות הנפשית והפיזית שלהם. זה גם שימושי שהצוות הזה רשם מראש את הפרוטוקול שלו. אבל העובדה היא שהמחקר הספציפי הזה באמת לא מספק ראיות מהותיות לכך שהורמונים משפרים את הבריאות הנפשית של ילדים טרנסים.
פוסט זה יעסוק בנקודות העיקריות הבאות:
1) לילדים במחקר זה היה שיעור התאבדות גבוה להחריד.
2) רוב השיפורים שחוותה הקבוצה היו קטנים.
3) אי אפשר לייחס את השיפורים שנצפו במחקר זה להורמונים ולא לצורות טיפול אחרות שהתקיימו במרפאות אלו.
4) השיפור הגדול היחיד היה במשתנה שאולי אינו בעל משמעות כל כך.
5) החוקרים אפילו לא שוקלים את האפשרות שטיפולים אלה לא עובדים – התשובה היחידה שלהם היא “יותר הורמונים”.
לילדים במחקר זה היה שיעור התאבדות גבוה להחריד.
בעוד שלמחברי המחקר היו בעיות אחרות עם שקיפות במחקר שלהם, הם מציינים בתקציר שלהם ששני משתתפים התאבדו. בגוף המאמר הם כותבים כי “[התאבדות] אחת [התרחשה] לאחר 6 חודשי מעקב והשנייה לאחר 12 חודשי מעקב.” אז בתוך שנה מתחילת קבלת ההורמונים, שניים מתוך 315 הילדים במחקר הזה מתו. הם גם מציינים שהיו 11 מקרים של “מחשבות אובדניות במהלך ביקורת מחקר”.
בוא נשים בצד את סוגיית האובדנות, מכיוון שהחוקרים לא סיפקו לנו את המידע הדרוש כדי לבחון נושא זה. “מחשבות אובדניות” יכולות להיות מגוון של דברים שונים, החל ממחשבות מזדמנות וחולפות על התאבדות ועד למחשבות רציניות הרבה יותר הכוללות תוכנית והשגת כלים הנדרשים לביצועה. “אני חושב שזה הוגן לומר שהשימוש שלהם ב’מחשבות אובדניות’ הוא דו-משמעי”, אמר חוקר התאבדות שלפעמים אני בוחר בו לתגובות בנושא הזה תוך שאני תמיד מציע לו לעשות זאת באנונימיות, מכיוון שהם לגמרי מחוץ למאבק בנושא רפואת מגדר לנוער. חוקרי המאמר שפורסם ב- NEJM אמנם ניהלו סולם של מדד מחשבות אובדניות כדי לתעד את זה באופן מדויק, אבל כפי שאנו יודעים מהפוסט הקודם – הם פשוט לא דיווחו על הנתונים האלה. אז אין דרך לדעת אם 11 המקרים בהם דווח על מחשבות אובדניות במהלך המפגשים עם החוקרים, נמצאים גבוה, נמוך או איפשהו באמצע בסולם.
באשר לשיעור ההתאבדויות שהתרחשו – דרך נפוצה למדוד ולהשוות את שיעורי ההתאבדות ותוצאות אחרות מסוג זה היא לחשב ביחס ל- 100,000 אנשים, בשנה. בארה”ב נתון זה עומד על 13.9, אם כי ניתן כמובן לחשב אותו מחדש מדי שנה והוא ישתנה באופן משמעותי לפי תת-קבוצה. הכי קרוב שנוכל להגיע לאומדן שנתי עבור האוכלוסייה הכללית בטווח הגילאים של המחקר (גילאי 12-20) הוא 14.2 התאבדויות לכל 100,000 חברי קבוצת הגילאים 15-24.
כפי שציין בפני מייקל ביגס, פרופסור לסוציולוגיה באוניברסיטת אוקספורד ומבקר תדיר של חקר מגדר לנוער, על פי מספר ההתאבדויות במחקר של NEJM, מדובר בכ-317 מקרי התאבדות בשנה לכל 100,000 מטופלים. זה די גבוה. אנחנו צריכים להיות זהירים כאן, כי שיעורים ל-100,000 הם מוזרים כאשר המספר המקורי הוא נמוך כל כך: התאבדות אחת פחות הייתה מפחיתה את השיעור בחצי, ועוד אחת הייתה מעלה אותו ב-50%. כששאלתי את חוקר ההתאבדות לגבי זה הוא השיב: “אני מסכים ששני מקרי התאבדות בקבוצת הגיל הזו ועבור גודל המדגם הזה – זה בוודאות גבוה בהשוואה לאוכלוסייה הכללית.”
אבל זה יהיה לא הוגן לומר “לילדים בקבוצה שלכם היה שיעור התאבדויות גבוה – הטיפול שלכם לא עובד.” אלה היו ילדים שכבר היו להם בעיות בבריאות הנפש; דיספוריה מגדרית עצמה עלולה להיות מטרידה למדי, וידוע שבאוכלוסיית הלהט”ב ישנו שיעור גבוה יותר של בעיות נפשיות. אז כנראה שאנחנו לא צריכים לצפות שלילדים במחקר זה יהיה אותו שיעור התאבדות כמו בני גילם מהאוכלוסייה הכללית. כשהעליתי את הנקודה הזו במייל עם חוקר ההתאבדות, הוא אמרו שהוא מסכים ש”יהיה כנראה מתאים יותר להשוות לשיעורי התאבדות של קבוצה אחרת עם בעיות בבריאות הנפש, מאשר לאוכלוסיה הכללית”.
למרבה הצער, אין לנו הרבה נתונים כאן. במכתב שפורסם ב- Archives of Sexual Behavior, ביגס חישב בעבר ששיעור ההתאבדויות במרפאת המגדר טביסטוק באנגליה היה 13 לכל 100,000 מטופלים בשנה, נמוך בהרבה ממה שנצפה במחקר של NEJM. ההשוואה הנוספת היחידה שיש לנו כאן ושתהיה הוגנת והינה מוזכרת גם כן במכתבו היא:
“רק מחקר אחד שפורסם דיווח על מקרי התאבדות בקרב מתבגרים טרנסג’נדרים. מרפאת המגדר לילדים בבלגיה סיפקה ייעוץ ל-177 בני נוער בגילאי 12 עד 18, שהופנו למרפאה בין השנים 2007 ל-2016: חמישה מהם (2.8%) התאבדו (Van Cauwenberg et al., 2021). הגיל הממוצע של הפניה היה 15, מה שמרמז על משך ממוצע של 3 שנים לפני המעבר למרפאת מבוגרים, המתורגם לשיעור התאבדויות שנתי של 942 ל-100,000. זוהי התמותה הגבוהה ביותר בהתאבדות שנרשמה עבור אוכלוסייה טרנסג’נדרית.”
אם כן, למדגם של ה- NEJM לא היה את שיעור ההתאבדות הגבוה של אותה קבוצה בלגית, אבל אין ספק שהוא גבוה.
זה לא אומר שההתאבדויות בקבוצת ה- NEJM נגרמו על ידי ההורמונים. “כמובן שאנחנו לא יכולים לייחס את ההתאבדויות האלה להורמונים חוצי מין, כי חסרה לנו קבוצת ביקורת”, אמר ביגס באימייל. “באותו האופן, אנחנו לא יכולים לייחס את השיפור להורמונים חוצי המין!” לזה עוד נשוב לכך בהמשך, אין צורך להעלות כאן טיעון סיבתי כדי להיות מודאגים. אחת ההצדקות הנפוצות ביותר לגבי מדוע רפואת מגדר לנוער שווה את זה למרות כל מה שאיננו יודעים עליה עדיין, היא שילדים יתאבדו אם לא יקבלו אותה. ובכן, הנה מדגם של ילדים שהייתה להם גישה אליה במסגרת איכותית כביכול, עם הרבה תמיכה ומעקב, ועדיין היה להם שיעור גבוה מאוד של התאבדות. איך זה לא מעורר שאלות? מלבד ציון מספר ההתאבדויות שהתרחשו והמקרים של “מחשבות אובדניות” – לחוקרים אין מה לומר על כך.
כאשר מסתכלים על פרוטוקול המחקר, עליו דיברנו הרבה בפוסט הקודם, הנושא רק הופך מדאיג יותר. ניתן לראות כי ילדים שסבלו מבעיות פסיכיאטריות חמורות, כולל אובדנות, לא נכללו בתחילת המחקר: “נוכחות של תסמינים פסיכיאטריים חמורים (כגון הזיות פעילות והפרעת מחשבה) העלולים לפגוע ביכולתו המשתתף לספק הסכמה מדעת אמיתית או ליישם את ה- ACASI [ראיון עצמי באמצעות הקלטת אודיו של מחשב]” היה קריטריון של אי-קבלה, כך גם “סערת רוח בולטת” (כמו אובדנות, סכנת רצח והפגנת התנהגות אלימה) בזמן מתן ההסכמה או ביצוע של ACASI”.
אם כן, ילדים יכולים לסבול מרמה מסוימת של אובדנות ועדיין להשתתף במחקר, החוקרים לא רואים באובדנות כנתון בינארי שקיים/לא קיים, אבל ילדים שהיו מאוד אובדניים, או מאוד לא בריאים מבחינה אחרת – לא נכללו במחקר. כלומר, למעשה הקבוצה שהשתתפה לא אמורה להיות קבוצה אובדנית במיוחד ולמרות זאת התרחשו שתי התאבדויות. זה לא דבר טוב, זה דבר שיש לראותו כדגל אדום שראוי להסבר. אין לנו הסברים, מכיוון שהחוקרים לא מצליחים לדווח על רמת האובדנות הכוללת של הקבוצה לאורך זמן, למרות שהיא חלק מהשערת הליבה שלהם. וכתב העת The New England Journal of Medicine, שפרסם את מה שידע שיהיה מחקר מעורר תשומת לב על נושא שנוי במחלוקת המקושר בשיח הציבורי כל הזמן עם אובדנות – לא ביקש מהחוקרים להסביר.
רוב השיפורים שהקבוצה במחקר חוותה היו קטנים
לפניכם רשומים השיפורים שנצפו לאורך זמן, כולם מובהקים סטטיסטית, בנוגע למשתנים עליהם דיווחו החוקרים על פי המודל הסטטיסטי שלהם. זכרו שהמחקר מתפרש על פני שנתיים:
התאמה חיצונית: עלייה של 0.96 מתוך 5 נקודות
השפעה חיובית: עלייה של 1.6 מתוך 100 נקודות
שביעות רצון מהחיים: עלייה של 4.64 מתוך 100 נקודות
דיכאון: ירידה של 2.54 מתוך 63 נקודות
חרדה: ירידה של 2.92 מתוך 100 נקודות
המספרים הללו הם השינויים הממוצעים עבור כל הקבוצה. במשתנים המודגשים היו שינויים מובהקים סטטיסטית עבור שני המינים. במשתנים שאינם מודגשים, היה יתרון לטרנסים (נ”ע: נקבות ביולוגיות) אך לא לטרנסיות (נ”ע: זכרים ביולוגים). ‘התאמה חיצונית’ ו’השפעה חיובית’ הם שני המשתנים היחידים שבהם החוקרים הצליחו לדווח על עליות חיוביות בשני המינים במהלך השנתיים של המחקר. (אני הולך להקדיש להתאמה חיצונית קטע בפני עצמו, אז לא אתייחס אליה כאן.)
בהתחשב בהבדלים הללו, היה מועיל אם החוקרים היו מפרטים באופן ברור מה היו השינויים הממוצעים עבור הטרנסים לעומת הטרנסיות, אחרי הכל הם קיבלו הורמונים שונים לחלוטין, אבל הם לא עושים את זה (והם גם לא מציעים שום השערות מדוע שני שליש מהמדגם שלהם היו נקבות ביולוגיות). אם אתם יודעים איך לקרוא את טבלה 3, אתם יכולים לעשות סוג של חישוב של חלק מהמידע הזה, אבל זה באמת צריך להיות ברור יותר.
השאלה הראשונה שצריך לשאול במצב כזה בו יש שיפורים מובהקים סטטיסטית שנראים קטנים בגודלם, היא האם הם חשובים. עשויה להיות השפעה מובהקת סטטיסטית שאינה מובהקת קלינית, כלומר היא לא מייצגת שיפור או החמרה ניכרים במצב הנמדד. סטטיסטיקאים מתווכחים על גודל השפעות כל הזמן, אבל לעתים קרובות אין תשובה ברורה לגבי האם מעט הוא מעט מדי. אני כן חושב שלפעמים בנוגע להשפעות סופר-קטנות, זה בסדר לפנות לשכל הישר. השפעה חיובית, כפי שנמדדה על ידי מדד מארגז הכלים של שירותי הבריאות הלאומיים של ארה”ב (NIH), עלתה ב-1.6 נקודות במהלך שנתיים, בתוך סולם של 100 נקודות. אם חוקר שמציע טיפול לילד שלך אומר “זה ישפר את הציון שלו בסולם הדיווח העצמי הזה ב-1.6% לאורך שנתיים”, ברור שתהיה סקפטי. אני ממש לא קונה את הרעיון שזה נתון חשוב או נתון שמהווה ראיה התומכת ברעיון שהורמונים עוזרים לילדים. (בדקתי אם למסמכים האלה של ארגז הכלים של NIH יש מידע כלשהו לגבי פרשנות של שינויים בציונים בהשפעה חיובית או בשביעות רצון מהחיים, אבל נראה שלא.)
מה לגבי כמה מהתוצאות האחרות שנראות קטנות אבל לא מאוד זעירות? האם כדאי שיהיה לנו אכפת מאלה?
כל מה שאנחנו יכולים לעשות הוא לנסות לבחון את המידע הקיים ולעשות השוואות. אחד המאמרים הבשרניים יותר שמצאתי בנושא מובהקות קלינית לעומת מובהקות סטטיסטית היה מטה-אנליזה ממאגר Cochrane Database of Systematic Reviews על “תרופות נוגדות דיכאון מהדור החדש לטיפול בדיכאון בילדים ובני נוער” (Cochrane נחשב לאחד המשחקים הטובים לסוג זה של הערכת מחקר זהירה). שם המחברים מסכמים מחקרים שהשוו את התרופות נוגדות הדיכאון הללו לפלסבו, והשתמשו במשהו שנקרא ‘סולם מתוקן לדירוג דיכאון של ילדים’ כדי לבחון תסמינים. ל-CDRS-R יש טווח של 17 עד 113, כלומר זה סולם של 97 נקודות. המחברים מתארים הבדלים גדולים, עד 3.51, כ”קטנים וחסרי חשיבות”. אז שוב, הבדל שאינו נראה זעיר כשלעצמו, עשוי להיות לא משנה מבחינה קלינית.
מאמר של חוקרים משנת 2015 שהוא רלוונטי יותר לדיון הנוכחי, בוחן את הרעיון של הבדל קליני בעל חשיבות מינימלית או “ההבדל הקטן ביותר בציון הנחשב ככדאי מבחינה קלינית על ידי המטופל”, כפי שהוא נוגע ל-Bek Depression Inventory 2 (BDI- II), שהוא הפריט שבו השתמשו חוקרי NEJM למדידת דיכאון במחקרם. המחברים משנת 2015 “העריכו MCID של ירידה של 17.5% מציוני הבסיס… ההערכה המקבילה עבור אנשים עם דיכאון ממושך יותר שלא הגיבו לתרופות נוגדות דיכאון הייתה גבוהה יותר ב-32%”. במודל הסטטיסטי של חוקר NEJM, למטופלים היה ציון בסיס ממוצע של 15.46 והפחתה ממוצעת של 2.54. מכיוון ש-17.5% מ-15.46 הם בערך 2.51, אם אנו סומכים על ההערכות הללו, הילד הממוצע במחקר NEJM כמעט ולא חווה שיפור בתסמיני הדיכאון בשנתיים בהם הוא קיבל הורמונים. (לא הצלחתי למצוא שום מחקר על מה נחשב שיפור משמעותי מבחינה קלינית במדד החרדה בו השתמשו החוקרים – ה-Revised Children’s Manifest Anxiety Scale, בו החוקרים צפו בשיפור ממוצע של 2.92 מתוך 100 נקודות.)
כמובן שלילד הממוצע היו רק תסמיני דיכאון קלים מלכתחילה, מה שהופך את הדברים לעוד יותר מסובכים לניתוח. למטופלים אחרים היו ציוני BDI-II גבוהים יותר בנקודת ההתחלה, מה שמאפשר לטעון שרק הפחתה גדולה תחשב משמעותית.
זהו תרשים שימושי מהנספח המשלים:
אני לא יודע מה לעשות עם זה. החוקרים מציגים את העובדה שהרבה ילדים עברו לרמות נמוכות יותר של דיכאון וחרדה במהלך המחקר, אבל גם מודים שחלק לא מבוטל מהם נשאר בתוך הטווח הקליני בפגישת המעקב. ברור שזה נכון. זו באמת סיטואציה מסובכת לפירוש, חלקית בגלל שהמספרים הבסיסיים הם כל כך מעורבים: זה לא הוגן למתוח ביקורת על חוסר השיפור אצל ילד שלא היה במצב כל כך גרוע מלכתחילה. זוהי בעיה בחלק מהמחקרים הקליניים של רפואת מגדר לנוער, הכוללים בדרך כלל סינון של משתתפים עם בעיות נפשיות חמורות: אין להם הרבה מקום לשיפור, כך שהסטטיסטיקה של חוקרים המבקשים להוכיח שיפורים בבריאות הנפש היא בעייתית. (אני מניח שהעובדה שהילדים בקבוצה הזו לרוב לא היו במצב גרוע משמעותית, הינה גם מידע חשוב.)
זה היה לתועלת אם החוקרים היו מספקים מידע מדויק יותר לגבי למשל השיפור המספרי הממוצע בקרב ילדים בטווחים המתונים או החמורים במדד הדיכאון. כפי שראינו בעבר, לדווח במקום זאת על אחוז המשתתפים בקטגוריות קליניות שונות יכול לטשטש מידע שימושי רב: במקרים הקיצוניים ביותר, ירידה של נקודה אחת שהמטופל אפילו לא שם לב אליה, יכולה להזיז אותו מרמה “מתונה” למשל, לרמה “קלה”. כדאי גם לדעת אם החלק הגדול יחסית של ילדים שלא סיפקו נתונים אחרי 24 חודשים, כשליש מהמשתתפים, היה שונה בנקודות זמן אחרות משאר הקבוצה, כי אם הילדים עם העדר הנתונים אחרי 24 חודשים היו בממוצע במצב טוב יותר או גרוע יותר מאשר עמיתיהם למחקר, זה עלול להטות את התוצאות בצורה משמעותית. (יכול להיות שאני מפספס משהו, אבל אני חושב שהחוקרים עושים את ההשוואה הזו רק לגבי המספר הקטן מאוד של נושרים מהמחקר ולא לגבי ילדים שטכנית נשארו במחקר אך לא סיפקו נתונים לגבי חלק מהמדדים בתצפית הסופית.)
בסופו של דבר, קשה להכחיש שהרבה ילדים נשארו במצב לא טוב, למרות שבמשך שנתיים הייתה להם גישה קבועה למרפאת מגדר ולתרופה שנועדה לשפר את בריאות הנפש שלהם. בתחילת המחקר, 18.6% סבלו מדיכאון בינוני, ושנתיים תמימות לאחר מכן 10% עדיין סבלו מדיכאון. השיפור שחל בדיכאון החמור הוא אפילו פחות: 15.6% ירד ל- 13.7%. אותו סיפור עם חרדה – 58.8% מהילדים היו בטווח הקליני של חרדה בתחילת המחקר ו-47.7% בתום תקופת המעקב.
מצד שני, קשה להתעלם מכך שברור שחלק מהילדים אכן חוו הפחתה משמעותית בדיכאון ו/או חרדה ו/או תסמינים אחרים. האם לפחות זה אינו מהווה עדות כלשהי ליעילותם של הורמונים?
לצערי…
לא ניתן לייחס את השיפורים שנצפו במחקר זה להורמונים ולא לצורות טיפול אחרות שהתרחשו במרפאות אלו.
זהו מחקר אורך ללא קבוצת השוואה. כפי שיגיד לכם כל בוגר קורס סטטיסטיקה, במצב כזה קשה הרבה יותר לטעון שגורם מסוים הוא האחראי לכל שינוי שנצפה לאורך זמן.
אם אתם עוקבים אחרי שתי קבוצות דומות אחרות במשך שנתיים, ואתם נותנים לאחת מהן תרופה ולשנייה פלצבו ומבחינים בהבדלים בין הקבוצות, אולי תוכלו להתחיל להסיק כמה מסקנות סיבתיות בטוחות למדי לגבי ההשפעות של התרופה, אם כי מידת הביטחון תלויה בשלל גורמים. אבל עם קבוצה אחת בלבד, מדובר בבעיה סטטיסטית ידועה, גם במצבים פשוטים יחסית. אם אני נותן לכם תרופה נגד שפעת וחמישה ימים לאחר מכן תסמיני השפעת שלכם השתפרו משמעותית, האם זה אומר שהתרופה עבדה? אולי. אבל גם מצבם של חולי שפעת נוטה להשתפר עם הזמן. ציונים בסולמות מסוימים נוטים גם לחזור לממוצע במידה והתצפית הראשונית הייתה גבוהה מאוד או נמוכה מאוד. וכו’. שוב, אלה הם באמת עקרונות סטטיסטיים בסיסיים, זה לא קשקוש.
מחקר ה- NEJM הוא הרבה יותר מסובך ממחקר שפעת של שבועיים. למעשה יש לנו כמה סיבות טובות לחשוד שגורמים אחרים אולי תרמו לשיפורים (הקטנים בעיקר) שנצפו על ידי החוקרים.
כפי שהם מציינים בשלב מוקדם במאמרם, “כל המרפאות המשתתפות מעסיקות צוות רב-תחומי הכולל מטפלי בריאות הנפש, ואשר קובע בשיתוף פעולה אם קיימת דיספוריה מגדרית והאם טיפול רפואי מאשרר מגדר מתאים. לקטינים נדרשת הסכמת הורים לתחילת טיפול רפואי. פרסומים של צוותי מחקר בודדים מספקים מידע בנוגע לגישות טיפול ספציפיות.”
המשפט האחרון הזה מצטט ארבעה מאמרים, ואם תקראו את המאמרים האלה תראו אזכורים לגבי טיפול ותרופות למטופלים שחווים לחץ נפשי שהוא מעבר לבעיות המגדר שלהם. דוגמה אחת למשל, הצוות בתוכנית לזהות מגדרית והתפתחות מינית בבית החולים לילדים לוריא בשיקגו כותב כי “במקרים בהם מתקיים גם טיפול מבוסס ראיות וגם טיפול תרופתי, הפסיכולוג והפסיכיאטר עשויים להוות את הצוות הטיפולי של המטופל – פסיכולוג כמטפל ראשוני ופסיכיאטר המציע טיפול תרופתי פסיכוטרופי”.
כל ילד במחקר זה נצפה באחת המרפאות הרב-תחומיות הללו, אז הגיוני להניח שאנשים עם בעיות חרדה ודיכאון רציניות קיבלו גישה לפסיכותרפיה, תרופות או שניהם. הגיוני גם שככל שתסמיני בעיות הנפש אצל ילד מסוים היו חמורים יותר בתחילת הדרך, כך גדל הסיכוי שהוא קיבל את אחת מהאופציות הללו והיה לו יותר מקום לשיפור. זה גם אומר שכאשר מדובר בתת-קבוצה של ילדים שהשיפורים שלהם היו ניכרים, עלינו לשאול: האם התסמינים שלהם פחתו בגלל ההורמונים, התרופות או הטיפול, או שמא היה זה שילוב של שלושתם?
אין דרך לדעת. זה למעשה הופך את התוצאות ללא ניתנות לפירוש מלא. זה חבל, כי אני מאמין שהחוקרים יכלו להסביר זאת במודלים הסטטיסטיים שלהם, שכן בוודאי הייתה להם גישה לרישומי מטופלים. אחת השאלות ששלחתי להם הייתה על הנושא הזה בדיוק, אבל כפי שציינתי בפוסט האחרון שלי, הם לא מתראיינים או מגיבים לשאלות.
למרות כל זאת, החוקרים מכריזים בביטחון בתקציר שלהם כי “[הורמונים מאשררי מגדר] שיפרו את ההתאמה למראה חיצוני ואת התפקוד הפסיכו-סוציאלי”. זוהי התנסחות סיבתית ישירה, בזמן שהמתודולוגיה שלהם לא מצדיקה זאת כלל. יתר על כן, הם אפילו לא מזכירים את הבלבול הפוטנציאלי הזה, וזה, שוב, מסוג הדברים שלומדים במהלך השנה הראשונה של קורס סטטיסטיקה.
תארו לעצמכם שאתם נתקלים בשאלה הזו תוך כדי קורס כזה:
קבוצת ילדים עם בעיות נפשיות מקבלת גישה לייעוץ פסיכולוגי, תרופות פסיכיאטריות וטיפול X למשך שנתיים. בתום התקופה הזו מצבם השתפר משמעותית. האם זה בגלל:
- הייעוץ
- התרופה
- טיפול X
- לא ניתן לדעת לא מידע נוסף
מאה מתוך מאה של פרופסורים לסטטיסטיקה, יגידו לכם שהתשובה הנכונה היא (4). (הפרשנות הנלווית של ה- NEJM על המאמר מאת אנלו דה ורייס וסבינה הנמה מזכירה את סוגיית הטיפול אך לא את סוגיית התרופות.)
קיימת בעיה פוטנציאלית נוספת בנוגע לייחוס השיפורים הניכרים במחקר לטיפול בהורמונים מאשררי מגדר, שחוקר דיכאון איתו התכתבתי במייל ציין בפניי. הוא אמר בתחילה שאני יכול לצטט אותו בשמו אבל אז שינה את דעתו וטען שהנושא טעון מדי. כששאלתי אם זה בסדר לתאר אותו כ”חוקר דיכאון”, הוא ענה, “בטח, אני אפילו אהיה בסדר אם תקרא לי ‘חוקר דיכאון שמשתפן לדבר בשמו המלא…”. (אני כולל את זה כי חשבתי שזה מצחיק, לא כי אני חושב שהוא שפן! אני לא מאשים אותו בכלל.)
הוא ציין כי החוקרים “מתעלמים לחלוטין מהנקודה הברורה על פיה לטסטוסטרון יש אפקט משמעותי בשיפור מצב רוח וכנוגד חרדה ודיכאון!” שמעתי אחרים מעלים נקודה זו בעבר, שמהווה אתגר רציני נוסף עבור חוקרי רפואת מגדר לנוער. אכן, ישנן עדויות לכך שלטסטוסטרון יש השפעה על שיפור מצב הרוח. זה מעלה את האפשרות שהוא יכול לגרום לשיפורים בתסמינים של בריאות הנפש שאינם קשורים לטיפול בדיספוריה מגדרית כשלעצמה. (אני רוצה להבהיר שהמחקרים אליהם אני מתייחס ומקשר, כוללים בדרך כלל זכרים ביולוגים ולא נקבות ביולוגיות, מבוגרים ולא צעירים, ולפעמים הם כוללים פרקי זמן קצרים משמעותית משנתיים. אז אנחנו לא יכולים לקבוע באופן סופי שלטסטוסטרון יש את אותן ההשפעות על נקבות ביולגיות צעירות לעומת זכרים ביולוגים מבוגרים, אבל זו בהחלט אפשרות וישנן כמה עדויות אנקדוטליות לכך בקרב נערים וגברים טרנסים [נ”ע: נקבות ביולוגיות].)
בואו נהיה שוב נדיבים ונניח את האפשרות הזו בצד. לסיכום שאר הסעיף הזה, גם אם נתמקד רק בילדים שהראו שיפור ניכר במחקר הזה, תוך התעלמות מההשפעות הממוצעות והקטנות, ההתאבדויות, התוצאות המאכזבות לגבי טרנסיות (נ”ע: גברים ביולוגים) ומה שנראה כקרנבל של בחירה בפינצטה – אין לנו דרך לדעת האם השיפור הוא בגלל ההורמונים, הטיפול, התרופות או שילוב של השלושה.
אני לא טוב בסטטיסטיקה, אבל אני לא צריך להיות טוב כדי להוכיח את הנקודה הזו. זה לא אזוטרי. זה נושא מאוד בסיסי ומוכר היטב במדעי החברה. זה מערער באופן משמעותי את היכולת שלנו לקבוע אם הילדים במחקר הזה אכן הרוויחו משימוש בהורמונים, וזה משקף את ההחלטה הגרועה של כתב העת The New England Journal of Medicine לאפשר לחוקרים להשתמש בשפה סיבתית כה ברורה וישירה כדי לתאר את התוצאות שלהם.
השיפור המשמעותי היחיד היה במשתנה שכנראה לא אומר הרבה.
מה שדיברנו עליו עד כה היה השפעה ממוצעת בקטנה, אך המחברים מדגישים ממצא אחד נוסף שנראה מרשים:
“הגברת ההתאמה למראה החיצוני היא המטרה העיקרית של טיפול מאשרר מגדר ואנו צפינו בשיפור בהתאמה למראה חיצוני במהלך השנתיים של הטיפול. זו הייתה השפעה מתונה. ההשפעה הגדולה ביותר שנצפתה בתוצאות שלנו, שתואמת את ההשפעה שנראתה במחקר הכולל דגימות אחרות, מראה שלטיפול מאשרר מגדר יש השפעה משמעותית על דימוי הגוף והשפעות קטנות עד בינוניות על בריאות הנפש. התאמה של מראה חיצוני נקשרה גם לכל תוצאה פסיכו-סוציאלית שנבחנה בתחילת המחקר ובמהלך תקופת המעקב, כך שעלייה בהתאמה למראה חיצוני נקשרת לירידה בתסמיני דיכאון וחרדה ולעלייה בהשפעה החיובית ושביעות הרצון מהחיים. ממצאים אלו מצביעים על כך שהתאמה של מראה חיצוני היא מנגנון שבאמצעותו [הורמונים מאשררי מגדר] משפיעים על התפקוד הפסיכו-סוציאלי.” [הערת שוליים הושמטה]
במשך שנתיים הילדים במחקר חוו שיפור של בערך נקודה אחת מתוך חמש בסולם ‘ההתאמה למראה חיצוני’ של מדד ההתאמה הטרנסג’נדרי.
מדד ההתאמה הטרנסג’נדרי הוא בעל 10 או 12 משתנים הרשומים לפניכם, כפי שהם מסוכמים בטבלת מחקר משנת 2021 במחקר על מיניות ומדיניות חברתית. זה המחקר החדש ביותר שהצלחתי למצוא שהכיל עריכה של הנתונים הפסיכומטריים שלו:
בסתיו האחרון כתבתי מאמר על הבעיה איתה מתמודדים חוקרים בתחום זה כאשר הם מציגים ממצאים מרשימים לכאורה, על ידי הסתמכות על מדדים שאולי אין להם משמעות רבה. במקרה זה, דיברתי על מחקר של ניתוחים במתבגרות שהכותרת שלו טוענת שהציונים של הילדות “השתפרו” לאחר כריתת שד כפולה, על פי סקאלה שהייתה מורכבת בעיקר משאלות כגון האם יש להן כרגע שדיים. אם תבקשו ממישהי עם דיספוריה מגדרית לדרג את מדד “החשש שאנשים מסתכלים על החזה שלי”, פריט שקיים בסקאלה המדוברת, לפני ואחרי שהיא עוברת ניתוח – זה יהיה מזעזע אם הציון שלה לא השתפר, אבל זה גם לא אומר לנו הרבה על האם כריתות שד כפולות “עובדות” לטווח ארוך, כמו שהיינו רוצים שניתוח רציני כזה יעבוד. המחקר המדובר לא כלל פריטים מהותיים יותר על בריאותן הנפשית של הנערות.
אני חושב שהמחקר של ה- NEJM עליו אנו מדברים כאן הוא גרסה של זה. למען ההגינות, מחברי המאמר ב- NEJM מדווחים גם על כמה מדדים נפוצים ומאומתים יותר, כולל כאלה המתייחסים לחרדה ודיכאון, אבל כפי שראינו, השינויים הללו היו קטנים ובעלי חשיבות קלינית מוטלת בספק, והם לא חלו על המעבר המגדרי של זכרים ביולוגים לנשים. שני המינים חוו שיפור בהתאמה למראה חיצוני וזו ההשפעה המשמעותית היחידה שהחוקרים הביאו, כפי שהם עצמם מציינים.
אבל יש בסיס לטעון שהמשחק כאן קצת מזויף. אם נסתכל על משתנים כמו “המראה החיצוני שלי מייצג את הזהות המגדרית שלי” ו”המראה הפיזי שלי מבטא בצורה נאותה את הזהות המגדרית שלי” – קודם כל, שני המשתנים האלה כל כך דומים שאני מופתע ששניהם נמצאים, זה נראה מיותר וכמעט בלתי אפשרי שהם לא ישתנו ביחד, מה שעשוי לגרום לציוני המשתתפים להראות מנופחים באופן מלאכותי. (אומנם לא חקרתי את זה לעומק פה, אך בתיאוריה, לפני שסולם מאושר לראשונה מישהו בודק אותו לגבי בעיות מסוג זה. ראוי לציין שבמאמר משנת 2021, המחברים מציינים שמשתנה אחד מתת-הסולם של ההתאמה למראה חיצוני הוסר עקב הדמיון הרב שלו למשתנים אחרים.)
יתרה מכך, כיצד הציון של משתנה כזה לא “ישתפר” כאשר השינויים הפיזיים בעקבות נטילת ההורמונים מגיעים ומקרבים את מצב הגוף לתחושה הפנימית. כלומר, אני לא רוצה לבטל לחלוטין את הממצא הזה. זה בהחלט יהיה רע אם לא יראו שיפור אחרי התהליכים הללו מכיוון שזה עשוי לרמוז שזהותם המגדרית של המטופלים או יעדי המעבר המגדרי שלהם השתנו באמצע הטיפול (מה שלא יהיה אידיאלי), אבל במקביל אני לא בטוח עד כמה אנחנו צריכים להתרשם מהנתונים האלה.
וכאשר מבחינים שסולם ההתאמה למראה חיצוני אינו נמצא בקורלציה עם מדדים אחרים ועוצמתיים יותר בנוגע לתחושת רווחה – זה נכון שבעתיים. כך מצאו מחברי המאמר משנת 2021:
אל תדאגו אם אינכם מצליחים לפרש את זה. הנקודה היא שמשתנה זה לא נמצא בקורלציה עם משתנים אחרים, מבוססים יותר. מבלי להיכנס לזה יותר מדי, המחברים מציינים שזה מתנגש עם מחקרים קודמים בנוגע למדד ההתאמה הטרנסג’נדרי ותתי-הסולמות שלו, שם נמצא שכן מתקיימת קורלציה חזקה עם משתנים אחרים. כאשר השינויים במדד ההתאמה הטרנסג’נדרי או בתת-הסולמות שלו חשובים כל כך מבחינה קלינית, זה נראה כמו שאלה פתוחה שכדאי לחקור יותר, אבל זו גם שאלה שאין עליה תשובה. אם זה השיפור הגדול ביותר שניתן למצוא במחקר ה-NEJM הגדול, עלינו לשאול את עצמנו כמה שאלות.
החוקרים טוענים שהם ביצעו עבודה סטטיסטית התומכת ברעיון שהתאמה של מראה חיצוני עשויה להיות חשובה במיוחד. הם כוללים את התמונה המפוארת הזו:
אחד מהאנשים אליהם אני פונה לעזרה בעניינים סטטיסטיים הוא סטיוארט ריצ’י, פסיכולוג מחקרי, מחבר הספר הנהדר “מדע בדיוני: כיצד הונאה, הטיה, רשלנות והייפ מערערים את החיפוש אחר האמת”, ובעל הניוזלטר באתר Substack עם אותו השם שנרכש לאחרונה על ידי העיתון הבריטי “i”.
שלחתי לו את התרשים הזה ואת הטענות של המחברים לגבי המודלים של עקומת הצמיחה הסמויה שלהם ומה זה מראה לגבי החשיבות של התאמה למראה חיצוני. למזלנו, ריצ’י פרסם מחקר שמשתמש בטכניקות סטטיסטיות דומות. “בעיני זה הגיוני שמדד ההתאמה למראה חיצוני ישתנה במקביל למדדי בריאות נפש אחרים, אבל זה לא אומר כלום לגבי האם שינוי בהלימות המראה משנה את מצב הבריאות הנפשית במובן הסיבתי”, כתב ריצ’י באימייל. “הסיבתיות יכולה בקלות ללכת לכיוון השני (כלומר שאנשים שהרגישו טוב יותר מבחינה נפשית, נטו לדאוג פחות לגבי המראה שלהם).” ריצ’י סיכם את החלק הזה במאמר ה- NEJM כ”דרך משוכללת להתעסק עם מתאמים ועם שום דבר סיבתי, די מעניין אבל לא מהווה טיעון כלשהו.”
חוקר הדיכאון האנונימי העלה את אותה נקודה בדיוק, באופן עצמאי, במייל. “המודלים של עקומת הצמיחה הסמויה אינם משכנעים במיוחד”, כתב. “כן, הם מציעים ששינויים בהלימה של מראה חיצוני נמצאים במתאם לשינויים במשתנים פסיכולוגיים אחרים, אבל אין שום הוכחה לסיבתיות שם, ואנחנו בהחלט יודעים שמדדים של דיווח עצמי תלויים מאוד במצב רוח – ולכן עלייה בדיכאון, למשל, תגרום כמעט בוודאות לירידה בתחושת ההתאמה למראה חיצוני.”
שניהם, ריצ’י וחוקר הדיכאון ציינו גם, כל אחד באופן עצמאי, את המספר הגבוה של קישורים חסרי משמעות סטטיסטית (הקווים המקווקוים) בתרשים לעיל. לא נראה שיש שם הרבה מה לראות.
החוקרים אפילו לא שוקלים את האפשרות שטיפולים אלו פחות יעילים ממה שהם חשבו – התשובה היחידה שלהם היא “יותר הורמונים”.
ישנו חלק במאמר, בו החוקרים מנסים להתמודד עם העובדה שהזכרים הביולוגים במחקר כמעט ולא הראו שיפור במהלך השנתיים שלהם על הורמונים:
“בהתחשב בכך שלחלק מהשינויים הפנוטיפיים העיקריים של אסטרוגן עשוי לקחת בין שנתיים ל-5 שנים כדי להגיע להשפעה מקסימלית (למשל, צמיחת חזה), אנו משערים כי ייתכן שיהיה צורך בתקופת מעקב ארוכה יותר כדי לראות השפעה על דיכאון, חרדה וסיפוק מהחיים. יתר על כן, שינויים הקשורים להתבגרות אנדוגנית בעקבות טסטוסטרון (למשל, קול עמוק יותר) עשויים להיות בולטים ויותר ניתנים לצפייה לעומת אלה הקשורים להתבגרות אנדוגנית בעקבות אסטרוגן. לפיכך, אנו משערים שההבדלים שנצפו בדיכאון, חרדה ושביעות רצון מהחיים בקרב בני נוער שהוקצו נקבות בלידה בהשוואה לבני נוער שהוקצו זכרים בלידה, עשויים להיות קשורים לחוויות שונות של מתח בעקבות היותם מיעוט מגדרי, מה שעלול לנבוע מהבדלים בקבלה החברתית של טרנס-נשיים (אנשים שהוגדרו כזכר בלידתם ומזדהים על הספקטרום הנשי) בהשוואה לאנשים טרנס-גבריים. ואכן, מתח של מיעוטים מגדריים קשור באופן עקבי להשפעות שליליות על בריאות הנפש, ומחקרים מראים שצעירים טרנס-נשיים עשויים לחוות יותר מתח מאשר נוער טרנס-גברי.” [ציטוטים הושמטו]
שני דברים בעניין זה: ראשית, אני לא חושב שזה באמת מסתדר עם העובדה שהשיפורים במדד ההתאמה למראה חיצוני היו שווים סטטיסטית בין זכרים לנקבות. כמובן שהתאמה למראה חיצוני היא רק היבט אחד של מעבר מגדרי מוצלח, אבל אם כל הקשיים הללו היו מפריעים לילדות טרנסיות (נ”ע: זכרים ביולוגיים) להרגיש טוב יותר אחרי שנתיים על הורמונים, זה היה מופיע במשתנה שעוקב אחר ההשפעות הפיזיות של ההורמונים הללו.
חשוב מכך, המדע אמור להיות בעל ראש פתוח. אם אתם בוחנים טיפול חדש, אתם אמורים להתייחס לאפשרות שהוא לא עובד כמתוכנן. יכול להיות שכל מה שהכותבים טוענים בקטע זה הוא נכון, אבל אי אפשר להתעלם משרשרת האירועים כאן: הם לקחו קבוצה של ילדים ורשמו להם טיפול הורמונלי. שניים מהם התאבדו. הזכרים הביולוגים לא חוו שום שיפור ניתן למדידה מלבד שיפורים זעירים בסולם ההשפעה חיובית ואחד, שחשיבותו מוטלת בספק, במדד ההתאמה למראה חיצוני. התגובה שלהם היא: אולי הילדים פשוט צריכים לקחת הורמונים זמן רב יותר. אין אפילו רגע של עצירה, הרהור או אי ודאות. רק דחיפה קדימה.
העובדה היא שחלק מחברי הצוות הזה הם לא רק קלינאים וחוקרים, אלא גם תומכים נחושים בטיפולים אלה. הם מאמינים חזק שטיפולים אלה עוזרים לילדים טרנסים, והם מפיקים רווח חומרי ממתן טיפולים אלה ומההשתתפות בדיון הציבורי עליהם. המצב הזה שבו תומכים נחושים עם דעות קיימות המוצהרות בבירור – הם אלה שמייצרים את מה שאמור להיות ראיות מדעיות מהשורה הראשונה (זה הרי כתב העת The New England Journal of Medicine) – לא אמור להדאיג אותנו קצת?
זה כנראה בלתי נמנע שבמקרים מסוימים, מי שתומך בטיפול מסוים יחקור את הטיפול הזה. אבל מן הראוי שלפחות נכיר במלכוד הפוטנציאלי הזה. כאשר הארגון Cochrane או המכון הלאומי למצוינות בבריאות וטיפול (NICE) של בריטניה מפרסמים ראיות מדעיות, ישנה ציפייה שהחנונים-הביורוקרטים האחראים על הפקתן יכנסו לתהליך ללא דעות מוקדמות חזקות ועם מעורבות סבירה בנוגע ליכולתם לבחון את הראיות באופן הגון. למעשה, חלק מהסיבה שהביקורות הקטלניות של Nice על הראיות למתן חוסמי גיל ההתבגרות לילדים והורמונים למתבגרים סימנו נקודת מפנה גדולה בדיון הזה, היא דווקא משום שמדובר במוסד מאוד מהימן.
אם Cochrane פרסם סקירת ראיות המראה כי תרופה נוגדת דיכאון מסוימת התעלתה על אחרות בפער גדול, ולאחר מכן התברר שלכותבת-שותפה בסקירה זו יש בעל שעובד בחברת התרופות שייצרה את התרופה האנטי-דיכאונית המדוברת ושהקשר הזה לא נחשף – זה מיד יטיל דופי במאמר. זה ייחשב לניגוד עניינים.
למה ההיגיון הזה לא חל כאן? אומנם מאמר בודד של כתב העת NEJM אינו זהה לסקירת ראיות מקיפה, אבל מדוע עלינו להתעלם לחלוטין מהמציאות שבני אדם הם בני אדם, וצוות חוקרים שמושקע עמוק בטיפול מסוים עשוי להיות לא מסוגל לבחון באופן קר את הראיות לטיפול זה?
אולי יש סיבה לכך שההיגיון הזה לא חל כאן בכלל, אבל אני לא יודע מה הוא. במיוחד שישנו היעדר מתמשך של סקירות שיטתיות על רפואת מגדר לנוער בארה”ב, ונקודה חשובה שמוטי גורין העלה כאן היא שכל מחקר בנושא זה הולך לקבל חשיבות גדולה מדי. זו עוד סיבה לדרוש מהחוקרים שעומדים מאחורי מחקרים אלה לעמוד בסטנדרטים הגבוהים ביותר של קפדנות ושקיפות.
אני לא חושב שזה קיים כאן. זו לא הפעם הראשונה שתומכים נחושים במעבר מגדרי בנוער מייצרים מחקר מפוקפק על כך. כפי שציינתי במאמר הראשון בנושא – במקרה זה אולי לא יהיה הוגן להטיח את כל סימני השאלה בחוקרים עצמם; חלק מהבעיות עשויות להיות תוצאה של העריכה של מגזין ה- NEJM, אבל בכל זאת: אנחנו עכשיו אחרי שנים רבות ומאות אלפי דולרים רבים שהושקעו במחקר הזה. החוקרים פרסמו את מה שהיה אמור להיות אחד מהמחקרים שוברי הקופות שלהם, וחסרות בו ראיות חיוניות לחלוטין שאנו זקוקים להן על מנת לבחון את הטיפולים הללו. חלפו שנים ואנחנו אפילו לא יודעים האם הקבוצה חוותה אובדנות מופחתת או דיספוריה מגדרית. מה שאנחנו כן יודעים אינו מעודד: שיעור ההתאבדות גבוה, השיפורים זעירים עד קטנים מלבד במדד מפוקפק אחד וברוב המדדים בנוגע לטרנסיות אין שיפור.
יש סיכוי שאם נבחן כראוי את הנתונים, יחד עם כל המשתנים החסרים והלא מדווחים – נראה שהחוקרים לא מצאו כלום. זה מתסכל שאנחנו עדיין נמצאים במצב שהאפשרות הזו קיימת. אלה שאלות שהיו אמורות להיענות.