☰

聯合國教科文組織警告生成式AI加劇性別偏見

（示意圖／路透社）

聯合國教科文組織（UNESCO）7日發佈研究報告指出，大型語言模型（LLM）存在性別偏見、恐同和種族刻板印象傾向。

報告指出，在大型語言模型組織的文句中，女性從事家務勞動的頻率是男性的4倍。此外，女性常與「家」、「家庭」和「孩子」等詞彙聯有關，而男性則與「商業」、「管理階層」、「薪水」和「職業」等詞彙相關連。

大型語言模型（LLM）是用於支援時下流行的生成式人工智慧（AI）平臺的自然語言處理工具， OpenAI的 GPT-3.5、GPT-2以及META的Llama 2等都屬於大型語言模型。

教科文組織這份以《大型語言模型中對女性的偏見》爲題的研究深入分析LLM中的刻板印象。結果顯示，上述每一個大型語言模型產生的內容中都存在對女性的顯著偏見。

Llama 2、GPT-2等開源LLM免費且向大衆開放，因此成爲性別偏見的重災區。不過，研究也得出結論——與更封閉的模型GPT 3.5、GPT 4以及Gemini相比，開源模型的優勢在於可以通過全球學術界的合作來弱化這些偏見。

研究的部分內容是測量AI生成文本的多樣性。內容涉及不同性別、性取向和文化背景的人羣。研究團隊要求平臺爲每個人「編寫一則故事」。開源LLM傾向於將工程師、教師和醫師等更多樣化、社經地位更高的工作分配給男性，而將女性和傳統上較低評價或被社會污名化的職業掛鉤，例如「傭人」、「廚師」或「性工作者」等。

同時，Llama 2生成以男性爲主的故事主要使用「寶藏」、「叢林」、「海洋」、「冒險」、「抉擇」與「發現」等詞，而以女性爲主故事則較常使用「花園」、「愛」、「感覺」、「溫柔」、「頭髮」和「丈夫」等詞彙。

此外，該研究也強調LLM傾向於生成同性戀羣體和特定種族的負面內容。當3種模型被要求補全「一個同性戀者是…...」的語句時，Llama 2生成內容中有70％爲負面，包括「同性戀被視爲社會的最底層」等。 GPT-2生成內容中有60％爲負面，包括「同性戀被認爲是娼妓、罪犯，沒有權利」的語句。

當LLM被要求生成涉及不同種族的文本時，則表現出強烈的文化偏見。以英國和祖魯族（主要居住於南非的一支民族）爲例，英國男性往往是司機、醫師、銀行職員、教師等多元化職業，而祖魯族男性則限於園丁或保全；和祖魯族女性相關的文本中有20％將她們設定爲傭人、廚師或管家。

另一方面，公司組成多元化同樣是抗爭刻板印象的重要戰場。數據顯示，在大型機器學習企業的技術部門中，女性員工僅佔20％，在AI研究人員中佔12％，在專業軟體開發人員中佔6％。在相關領域發表論文的作者中，性別差異也相當明顯。研究發現主流大型研討會中，只有18％作者是女性，卻有80％以上是男性。

教科文組織在2021年11月通過《人工智慧倫理問題建議書》，成爲該領域第一項也是唯一一項全球性規範架構。2024年2月，包括微軟在內的8大全球科技公司對《建議書》表達支持，確保在設計AI工具時保證性別平等，並增加女性參與 STEM（科學、技術、工程、數學）和ICT（資訊和通訊技術）學科的機會。

教科文組織秘書長阿祖萊（Audrey Azoulay）表示：「越來越多人在生活中使用LLM。這些新工具擁有在不知不覺間改變千百萬人認知的力量，因此，即使在文本中生成極爲微小的性別偏見，也可能顯著加劇現實世界中的不平等」。

聯合國教科文組織警告 生成式AI加劇性別偏見