第13章 兌換!
伴隨系統提示音落下,一股關於文本分析的龐大信息流,便徑直湧入沈庭的腦海。
文本分析的核心框架與技法,大致分為三個部分:
首先是書面語言分析,聚焦於「用語習慣」。
每個人的用詞遣句,都有著自身的獨特性。
這與地域、職業、教育背景、文化薰陶乃至時代特徵息息相關。
分析文本中反覆出現的特色詞彙、非常規搭配、特定領域的術語或黑話,甚至語法結構的偏好,就能逆向推斷出書寫者的成長環境、可能籍貫、從事的職業或長期沉浸的亞文化圈。
比如,頻繁使用「俺」、「咱」自稱,可能指向北方某些方言區。
習慣用「啥」代替「什麼」,也有其地域傾向。
某些特殊的兒化音運用,如「這人兒」,同樣可以成為線索。
而文本中,如果出現了「帳戶對沖」、「槓桿比率」、「量化寬鬆」等術語,那麼書寫者很可能從事金融或相關行業。
若滿是計算機代碼縮寫或網絡黑客俚語,背景自然指向計算機領域。
其次,是文字布局與格式分析,也稱為「空間表達」。
研究表明,字跡在紙張上的整體排布方式,包括頁邊距的寬窄、行間距的疏密、字與字之間的擁擠或鬆散程度,以及每行字跡基線的整體走向,是平直、上翹還是下滑……
這些宏觀特徵,往往與書寫者當下的情緒狀態、長期性格傾向、甚至潛意識的心理活動有關。
比如,如果通篇留白極多、字距稀疏,可能暗示書寫者性格孤僻、喜歡保持距離感;
反之,字距擁擠、緊貼行線,可能反映其內心焦慮、或性格較為吝嗇保守。
如果一行字明顯向上傾斜,常與情緒樂觀、亢奮或野心相關;
而整體向下傾斜,則可能暗示沮喪、疲累或消極情緒。
最後,也是文本分析中技術性最強、在司法領域應用最廣的部分:筆跡鑑定。
這關乎書寫的「動力學特徵」,具有高度的個體特異性。
每個人的執筆姿勢、運筆力度、筆畫間的連筆方式、起筆收筆的鋒芒、轉折處的角度、甚至是一些細微的顫動習慣,都如同指紋一般難以完全模仿。
在法庭上,經過嚴格比對的筆跡鑑定結論,是證明文件真偽、關聯特定人員的強力證據之一。
分析筆跡,不僅能做同一認定,有時也能推斷書寫時的身體狀態,如是否受傷、醉酒,或情緒波動。
沈庭快速掌握了文本分析的相關知識,他再次看向炸彈狂人留下的那些挑釁信,看向最終落款的「BFE」,也看向信中的每一個單詞、每一處筆跡細節。
這一次,他看到的不再單純是文字。
原本被忽略的,隱藏在字裡行間的地域特徵、職業痕跡、情緒變化等等,似乎都有跡可循。
只要深入研究,沈庭有種直覺,必定能有所發現。
「開始吧!」
沈庭低聲自語,將炸彈狂人留下的所有文字資料,全部調取出來,開始研究……
文本分析的核心框架與技法,大致分為三個部分:
首先是書面語言分析,聚焦於「用語習慣」。
每個人的用詞遣句,都有著自身的獨特性。
這與地域、職業、教育背景、文化薰陶乃至時代特徵息息相關。
分析文本中反覆出現的特色詞彙、非常規搭配、特定領域的術語或黑話,甚至語法結構的偏好,就能逆向推斷出書寫者的成長環境、可能籍貫、從事的職業或長期沉浸的亞文化圈。
比如,頻繁使用「俺」、「咱」自稱,可能指向北方某些方言區。
習慣用「啥」代替「什麼」,也有其地域傾向。
某些特殊的兒化音運用,如「這人兒」,同樣可以成為線索。
而文本中,如果出現了「帳戶對沖」、「槓桿比率」、「量化寬鬆」等術語,那麼書寫者很可能從事金融或相關行業。
若滿是計算機代碼縮寫或網絡黑客俚語,背景自然指向計算機領域。
其次,是文字布局與格式分析,也稱為「空間表達」。
研究表明,字跡在紙張上的整體排布方式,包括頁邊距的寬窄、行間距的疏密、字與字之間的擁擠或鬆散程度,以及每行字跡基線的整體走向,是平直、上翹還是下滑……
這些宏觀特徵,往往與書寫者當下的情緒狀態、長期性格傾向、甚至潛意識的心理活動有關。
比如,如果通篇留白極多、字距稀疏,可能暗示書寫者性格孤僻、喜歡保持距離感;
反之,字距擁擠、緊貼行線,可能反映其內心焦慮、或性格較為吝嗇保守。
如果一行字明顯向上傾斜,常與情緒樂觀、亢奮或野心相關;
而整體向下傾斜,則可能暗示沮喪、疲累或消極情緒。
最後,也是文本分析中技術性最強、在司法領域應用最廣的部分:筆跡鑑定。
這關乎書寫的「動力學特徵」,具有高度的個體特異性。
每個人的執筆姿勢、運筆力度、筆畫間的連筆方式、起筆收筆的鋒芒、轉折處的角度、甚至是一些細微的顫動習慣,都如同指紋一般難以完全模仿。
在法庭上,經過嚴格比對的筆跡鑑定結論,是證明文件真偽、關聯特定人員的強力證據之一。
分析筆跡,不僅能做同一認定,有時也能推斷書寫時的身體狀態,如是否受傷、醉酒,或情緒波動。
沈庭快速掌握了文本分析的相關知識,他再次看向炸彈狂人留下的那些挑釁信,看向最終落款的「BFE」,也看向信中的每一個單詞、每一處筆跡細節。
這一次,他看到的不再單純是文字。
原本被忽略的,隱藏在字裡行間的地域特徵、職業痕跡、情緒變化等等,似乎都有跡可循。
只要深入研究,沈庭有種直覺,必定能有所發現。
「開始吧!」
沈庭低聲自語,將炸彈狂人留下的所有文字資料,全部調取出來,開始研究……