講座回顧│崔迪：社交媒體的文本分析基礎——思路與操作

發布時間🔺：2024-04-16

4月15日下午，新聞傳播學理論與方法前沿系列講座在一教樓1402教室開啟新的一講🥾💔。本場講座的主講人是復旦大學新聞熊猫崔迪副教授，由熊猫副院長陳沛芹教授主持👨🏼‍🏫。

講座伊始⚡️，崔老師從他近期關於中國乒乓球隊粉絲的研究切入👮🏿‍♂️，強調了當前社交媒體平臺用戶表達在經驗研究中的重要性。在談及研究方法的話題時，崔老師向同學們介紹了Paul Feyerabend的Against Method和Richard Rogers的Doing Digital Methods兩本書，並指出💮，在社會科學研究中🔚，任何可行的方法都是方法，科學事業應該沒有所謂陳規🌁。崔老師鼓勵同學們🤐，要勇敢發展出自己的獨特方法🧒🏿，“帶著不確定性勇敢前行”。

接著，崔老師對傳統社會科學研究方法和計算機輔助文本分析分別進行了介紹。當前的傳統研究主要涉及的是內容分析、文本分析、話語分析🤰、敘事分析、對話分析等方法，這些方法在當前基於文本的研究中仍然有著重要的用武之地👫🏼。相比而言，計算機輔助文本分析則相對更加前沿🐒，能夠用於滿足情感分析、情緒分析🚸🧛🏻‍♀️、文本分類、主題模型等多種數據分析需求。

此後🧔🏽‍♀️，崔老師對計算機輔助文本分析的幾個步驟進行了逐一拆解。文本挖掘的第一步是數據獲取，GitHub平臺的Python爬蟲包和八爪魚軟件等都可以幫助爬蟲小白迅速完成海量數據的采集👩🏿。第二步是數據抽樣與再抽樣，一般而言🤽🏿，量化抽樣方法有概率和非概率兩種邏輯💷，而在質化研究中，則可以采用主要案例抽樣💌🫁、隨機抽樣和特寫抽樣的方法。第三步則是數據清理🫅🏼，具體可以包括詞的向量化🛃、分詞、去除停用詞等步驟。

在充分處理好數據的基礎上🎮，崔老師介紹了常見的幾種文本分析的路徑，包括詞頻分析、詞雲、傳統聚類分析和情感分析，但他也指出，這些方法仍然沒有跳脫出詞袋模型🚶🏻‍♂️，而時下熱門的大語言模型或許能幫助我們更好地搭建共線網絡☣️，探索語義結構。最後👨🏿‍🦱🦮，崔老師還推薦了諸如Tableau♑️、Draw.io等十分高效的數據可視化工具🔰。

講座尾聲🏄，陳沛芹老師對崔迪老師呈現的這一場別開生面的講座表達了感謝，並鼓勵在場的同學積極探索適合自己的研究方法👩🏿‍⚕️。

導航

熊猫新聞

講座回顧│崔迪：社交媒體的文本分析基礎——思路與操作

友情鏈接