公告版位

目前分類:未分類文章 (4)

瀏覽方式: 標題列表 簡短摘要

這本冊想beh kā阮這十幾冬以來,有關台語文語料處理ê做法、成果kah一寡經驗,做khah詳細完整ê整理kah討論,同時mā介紹現有ê台語文線頂資源,一方面kā這段時間真濟友志做陣拍拚ê成果做記錄,另外一方面,mā向望透過chia ê介紹,鼓勵少年輩ê朋友加入這个少人行無人疼m̄-koh真有意義ê領域。
筆者是台北人,雖然自細漢講台語,總是讀國民小學了後,大環境ê關係,台語就漸漸拍無去,一直到讀大學,受著政治方面ê啟蒙,雄雄發現hŏng騙真久,開始關心台灣了後,才koh kā台語勻勻仔khioh轉來,1987年接觸著台語文,深深感覺台語ê傳承,文字是足要緊ê家私,chŏaⁿ規身撩落來,kā台語文成做一生ê志業。
因為台語文,ùi羅馬字(白話字)切入,才發覺台語文早就已經有濟甲若山ê文獻chhāi tī hia,了後koh發現,日本時代mā留足豐沛ê台語文本落來,濟甲讀袂完,雖然chia ê資料攏khah真oh-tit看著。
筆者是讀電腦ê,tī台大資訊系讀書ê時,本成讀甲小可無意無意,m̄知是m̄是beh繼續行落去,四年ê時,中央研究院資訊所陳克健老師來阮系開「自然語言處理」這門選修課,拍開我心內一扇窗,原來資訊ê專業會使運用tī語言處理方面。當其時讀ê教科書是teh討論英文beh按怎處理,華文彼陣才beh起步niǎ。
因為這个因緣,退伍了後我就去中研院資訊所詞庫小組食頭路,tè陳老師學工夫,陳老師成做後來我碩士kah博士ê共同指導老師。這期間考著清華資訊所去hia讀碩士,mā繼續tī詞庫小組做兼任助理。彼陣開發中文ê語詞檢索系統,中文語料ê內碼ùi電信碼、shift BIG-5 beh轉過去BIG-5,轉袂過ê漢字就用“”來表示,若去看hia ê語料,會看著滿天星,實務ê經驗予我深深感覺,資料若清氣,人生是彩色ê(至少khah好食睏),資料品質若bái,寫程式以外愛koh做真濟dirty work。
除了語詞檢索,koh有開發文稿校對系統,因為古文beh用人工校對實在真艱苦mā無效率,khah省錢ê方法是請兩間拍字行拍仝一份文本,了後用電腦系統揣出兩个電子檔案無仝ê所在,人工看這部分就好。碩士論文做文件自動分類,tī無用辭典ê情形,ùi文章內底揣出會當做分類標準ê關鍵詞,用chia ê關鍵詞來做文件分類,彼陣WWW才當起步,Google iah未出世。
Kā時間se̍h翻頭,做兵退伍轉台灣ê時,有接觸鄭良偉教授kah 伊開發ê TW301台語輸入法,對有電腦背景ê筆者來講,beh了解這个台語輸入法ê運作並無困難,會當家己修正、增補詞庫內容。讀碩士班ê時,真濟間學校已經有台語文相關社團,逐家做陣tī 1992年成立學生台灣語文促進會,我做第一任會長,會長有一个重要ê工課,就是發落《台語學生》這份機關刊物ê發行,《台語學生》一個月出三期,各校社團輪流編,負責ê社團愛家己寫稿、拍字,我這爿才彙[lūi]整,TW301輸入法(包括我增補ê詞庫)對刊物ê發行有真大ê幫贊,彼時陣ê台語文刊物,親像《台文通訊》等等,mā受著TW301大幫贊。
1999年筆者去大漢技術學院教書,思考家己ê研究方向,才開始考慮台語文kah電腦結合ê可能性,總是心內小可驚驚,一方面,進前並無人開創這个領域,是m̄是會當行出一條路,一屑仔把握都無,另外一方面mā無啥物基礎資源thang好運用,彼陣iah無線頂台語辭典,無充足ê語料。會記得有一擺請公假去世界台文營報告台語相關ê電腦工具,轉來beh報出差,會計室kā出差單退轉來,kā你寫講「與專業不符」。一直到2004年決定beh讀博士班,想beh做台語計算語言學方面ê研究,有幾个老師好心kā我提醒,做這可能無法度畢業。
有資源當然就kā sa來用,無資源就家己想法度kā生出來,進前tī詞庫小組練工夫,這馬會當發揮ah,啥物是台語無、華語有ê物件,kā做看覓就著ah,橫直有樣看樣無想家己想。總是台語文ê書寫加誠無一致,這表示愛做比中文koh-khah濟ê dirty work。Ùi 2000年利用鄭良偉教授提供ê詞條開發台華線頂辭典,了後kā家己ê庫存語料加上請台文刊物編輯提供,以chia ê語料做基礎,2003年開發台語文語詞檢索系統,紲落來koh kā書架仔頂頭古早ê台語書提去影印店scan轉做圖檔,2007年開發台語文記憶系統,想著啥物有需要就kā舞看覓。除了家己想beh做ê,koh有一寡是因為計畫ê壓力,硬kā chiⁿ出來ê,親像台文館ê台語發音系統kah台語文數位典藏資料庫,抑是教育部台語字詞頻統計等等,陸陸續續做出十幾个線頂系統,當然,大部分是團隊合作ê成果,m̄是家己一个人ê功勞。
會記得彼陣beh做進前,攏會先kā問題想予khah徹底leh,抑是先寫一个小程式試一下仔鹹汫,時機若成熟,揀一个無排課ê下晡,研究室門關起來mài予學生來枵飽吵,就撩落去緊寫程式,因為有家庭、有頭路,無才調無食無睏一直kā做落去,愛分幾lō遍;門關幾lō擺了後總算kā系統ê初胚完成,就先kā掛上網,koh換去使用者ê角度來想,看按怎改進會khah好勢,有ê idea想一、兩個月,有ê甚至考慮一、兩冬,有明確ê想法抑是揣著khah好ê解決方案了後,才chhiâu一个適當ê時間撩落去改。
會當將家己ê專長(電腦)kah興趣(台語文)結合做伙,後來行出一條路,過程雖然誠辛苦,總是心情是歡喜ê。不管按怎,ùi無啥會曉講台語到kā台語文工課當做一生ê志業,ùi大學開始不時想beh改途到一直讀起li(這馬tī台語系教書,mā算是改途ah),ùi可能袂畢業到終其尾提著博士學位(代價是身體規組害了了,ùi頭殼到跤底攏有koh-iūⁿ),人生確實是oh得按算。

人生oh得按算ê代誌m̄-nā這幾項,我tī 30歲ê時陣有做一擺大冒險,放棄台北穩定ê頭路走去花蓮度日子,頭前三年換五个頭路,換去第五个頭路,大漢技術學院做老師彼年(1999),校長kā阮講,舊年(1998)規年台灣ê出生人口比大專校院ê招生人數koh-khah少,所以18冬後會有危機,彼時學生濟,上課上甲歪腰,一點仔mā感覺袂出來,總是過無幾冬,學生數就開始直直落,敢ná teh趨流籠。有一擺參加研討會,洪惟仁老師kā我講:你tī大漢[Tāi-hàn]袂大漢[tōa-hàn]!
去花蓮生活是為著beh過逐工看山看海ê日子,m̄-koh beh大漢,必須愛有改變。後來到台中教育大學台灣語文學系教書(tī chia上課攏用台語,有夠好ê好),koh後來,離開蹛16冬蹛甲四序四序ê花蓮,規家伙仔搬來台中,雖然心內iah-koh定定teh數想,拍開窗仔門就會當看著青leng-leng ê太平洋。
決定beh寫作了後,這段期間搬兩擺厝,加減影響著寫作ê進度,總是mā kā交出來ah。
Tī這本冊,kā阮所知ê,最近10外冬來台語文語料處理方面相關ê進展kah成果,做初步ê整理kah記錄,希望chia ê成果,會當成做以後相關研究ê基礎,mā希望透過相關線頂系統ê介紹,逐家thang好好仔來運用chia ê工具,加速台語文ê推展。總是個人見識有限,難免有落勾ê所在。

另外,mā特別感謝秀蓮kah理揚幫贊校對、編輯、...等等出版進前li-li-khok-khok ê工課,予這本書會當順利出版。
歐美一寡大學有計算語言學ê相關系所,中國ê北京大學有計算語言學研究所,比較起來,台灣ê學界,對計算語言學這門學科是相對khah無重視ê,華語是按呢,台語就koh-khah m̄免講。(台灣ê語言學界另外一个問題是,普遍khah無注重本土語言。)
可能是因為台語文處理相對khah冷門,mā可能同時有電腦技術koh對台語文有興趣ê人並無濟,加上伊tī資源分配方面本成就足弱勢。一路行過來ê感覺是,這條路不止孤單、辛苦,進展mā算無緊。
對台語文ê發展,到底應該愛樂觀抑是悲觀,逐家可能有無仝ê看法。一方面,台語tī家庭ê使用ná像愈來愈少,少年家對台語愈來愈無感情;另外一方面,透過國校一禮拜一節ê本土語言課,koh看著台語生湠ê一寡成果,甚至部分已經放棄使用母語ê家庭,因為囡仔學習ê需要,koh kā母語khioh轉來用,有淡薄仔恢復ê趨勢出來。
大環境予咱警覺著台語可能會綴時間漸漸仔衰微去,因為當阿公、阿媽彼沿勻勻仔凋零,爸母彼沿因為讀書ê時hǒng禁止講家己ê母語,造成母語能力降低,囡仔會當接觸母語ê機會減少,會自然失去對母語ê感情。M̄-koh換另外一个角度來看,網路這个媒介,有伊深遠ê影響力,koh予咱感覺會使透過這个工具,對母語來做khah好ê保存kah推展。
資訊技術ê變動誠緊,以目前ê情形來看,包括智慧型手機ê應用程式,抑是電子冊ê部分,攏是台語文值得發展ê所在,真久以來koh有一个想法,台語文若beh興,愛結合線頂遊戲,chia ê攏是未來值得好好仔開拓ê部分。
希望透過這本冊所整理ê、濟濟對台語文處理付出kah拍拚ê成果,會當吸引koh-khah濟人行入挽救、推廣台語ê路。咱確實無悲觀ê權利,只有繼續一路行向前。
而且拍死無退!

文章標籤

ungian 發表在 痞客邦 留言(0) 人氣()

7/17

早上要離開格林德瓦時,看到一台露營車,他們是騎腳踏車旅遊,住旅館,但是不吃旅館的餐,所以在這裡準備早餐。

DSC08564.JPG

搭遊覽車到伯恩,這裡是瑞士首都,這裡有U形河道,地理位置易守難攻,舊城區列名世界遺產。不過Joyce說,這裡的氣候冬冷夏熱,比起瑞士其他城市,不算是好的居住地。

undefined

舊城區的騎樓(亭仔跤),很有美感。

undefined

舊城區的道路是石板路,在這裡看到了公用自行車,比較像倒掉的o-Bike那種,不是固定停放位置的。

undefined

沒有教堂,就不叫舊城區了。

undefined

在伯恩吃完午餐,接下來要跑去法國一下:童話小鎮柯瑪。

這裡比較特別的是木架屋,有的木架屋頭重腳輕,因為建造時,收的房屋稅是以1F面積來課稅,上有政策下有對策,所以2F以上蓋比較大,可以增加使用面積但不會被加到稅。不過木架沒那麼堅固,久了有的會稍微傾斜,所以之後再做一些補強,成了現在的模樣,而宮崎駿霍爾的移動城堡的靈感,就來自這裡。

undefinedundefined   

undefined   undefined

至於有的房子屋頂很斜很高,主要是當初是用來曬皮革的。這跟台灣的煙樓的概念有幾分類似。

我問領隊Joyce,德國人和法國人長相有沒有不同?她說法國人的鼻仔比較尖。仔細看,好像是真的。

晚上住宿在亞爾薩斯酒鄉秘密飯店,看到亞爾薩斯這個名字,想起小時候國小課本讀到的「最後的一課」,這裡是德、法兩強的交界處,所以命運就不脫兩強的影響,原來屬法國,普法戰爭後變普魯士,一戰德國是戰敗國,所以又變法國領地,二戰時又變德國,二戰後又變法國。以後還會不會再變呢?當然,最後的一課,背後的意識型態很清楚,但是實際上是如何,居民的意識未必是作者的意識。網路上有些討論,在這裡就不多說,就文學的層次來說,至少是篇佳作。

Google說今天的路程是

undefined

 

7/18

(還沒寫完...)

Google說今天的路程是

undefined

 

    

ungian 發表在 痞客邦 留言(0) 人氣()

ungian 發表在 痞客邦 留言(0) 人氣()

ungian 發表在 痞客邦 留言(0) 人氣()