리브레오피스(LibreOffice)의 한글-한자(漢字) 변환사전의 내용 수정 및 적용
한글-한자(漢字) 변환사전의 오류를 확인하다, 처음으로 리브레오피스(LibreOffice)에 기여(寄與)/공헌(貢獻)[Contribution]을 하였습니다.
저는 2018년 5월 19일, LibreOffice프로젝트에 소스코드에 기여을 해보았습니다.
올해 초, 저는 Apache Foundation(아파치 재단) Open Office(오픈오피스)와 TDF(The Document Foundation, 문서재단)의 Libre Office(리브레오피스)에 탑재된 한글-한자(漢字)변환 목록의 내용에 상당히 잘못된 내용이 들어갔다는 것을 인지하였습니다.
안녕(安寧)하세요(means “Hello” in Korean, reads “annyeonghaseyo” in Korean)의 안(安)이 “암”에 들어가는 것을 확인하였습니다.
즉, ‘안(an)’으로 읽는 한자 ‘安(안), 岸(안), 按(안), 晏(안), 案(안), 眼(안), 雁(안), 鞍(안), 顔(안), 鮟(안), 閼(안), 侒(안), 偐(안), 喭(안), 桉(안), 犴(안), 贋(안), 顏(안)’에 대한 음이 LibreOffice에서는 ‘암(am)’으로 처리되고 있었다는 심각한 문제를 발견하였습니다.
그리고 “선(Seon)”으로 읽는 한자들이 “긍(Geung)”으로 들어가는 경우도 보았습니다.
실제로 읽는 한자음들 목록 先(선), 線(선), 鮮(선), 仙(선), 善(선), 船(선), 選(선), 宣(선), 旋(선)
예시) 선생님(先生님) — means ’teacher’, reads ‘seon-shaeng-nim’ in Korean.
경부선(京釜線) — means ‘Railway line from Seoul to Busan in Korea.’ reads ‘Gyeongbuseon’ in Korean.
조선(朝鮮) — means ‘Korea’, reads ‘Joseon’ in Korean
칠요주선(七曜周旋) means ‘ Revolution of seven yaos’, reads ‘chil-yo-ju-seon’ in Korean. etc.
LibreOffice에서 ‘선(Seon)’에 대한 한자음 목록이 없음을 확인하였습니다.
현재의 LibreOffice에서 ‘선(Seon)’이라는 음을 가진 한자가 긍(先), 긍(線), 긍(鮮), 긍(仙), 긍(善), 긍(船), 긍(選), 긍(宣), 긍(旋) 으로 변하는 것을 확인하였습니다.
추가로, 단(單), 단(壇), 세(洗),환(還)이란 한자가 ‘선’으로 읽는 경우가 있습니다.
선우(單于)
선[洗] — 출처: http://encykorea.aks.ac.kr/Contents/Item/E0032595
갈월여선귀재(曷月予還歸哉)
위와 같이 한자음이 여러 개가 존재하는 경우에 대한 내용도 추가를 하였습니다. 그리고 측(昃)이 ‘치’로 적혀있는 오류도 수정하였습니다.
일월영측(日月盈昃)
추가로 조선 개국공신, 여진족(女眞族)/만주족(滿洲族) 출신, 이지란(李之蘭)의 여진족(女眞族)/만주족(滿洲族) 이름인 퉁두란(佟豆蘭/佟豆蘭帖木兒)의 퉁(佟)도 없는 것도 확인하였습니다.
추가로, 즙(汁)에 대한 한자음 누락도 확인하였습니다.
다음은 즙(汁)에 대한 한자낱말 예시입니다.
액즙(液汁)
무즙(무汁)
밤즙(밤汁)
잣즙(잣汁)
차즙(茶汁)
즙물(汁물)
‘즙’에 대한 음을 가진 한자 누락도 추가하였습니다.
그리고 Windows 와 libhangul에서 사용하는 한자 목록을 참고로 누락한 한자음을 추가하였습니다.
한글-한자(漢字)변환 목록확인 LibreOffice의 commit 로그를 확인해보니
First commit: 2003/06/05 18:43:02 khong 1.2.20.1: #110060# add tow characters in Hangul/Hanja conversion (Rüdiger Timm committed on 12 Jun 2003 )
2003년에 khong이라는 닉네임을 사용하는 분께서 최초의 커밋을 하였다고 나와있습니다.
즉 2003년도에 잘못된 내용이 들어간 커밋내용이, 2018년 현재까지 적용되는 것을 확인하였습니다.
저는 2018년 1월 부터 5월 19일까지 한국 한자음 목록이 잘못된걸 검사를 하였습니다.
그러면서, 2018년 4월 21일 토요일, 친구결혼식으로 서울(Seoul, Korea)청량리역(淸凉里驛)에서 경상북도 안동시(慶尙北道 安東市, Andong city, Gyeongsangbuk-do Province, Korea)의 안동역(安東驛)가는 기차에서 한자(漢字)목록 오류를 열심히 수정하기도 하였습니다.


몇 개월간 수정 작업한 결과, 최종본 작업 완료를 하였습니다.
최종본 https://github.com/libreoffice-kr/hanjadict/blob/master/hhc_char/hhc_char.dic
위의 내용을 바탕으로 LibreOffice의 소스코드에 제출을 하였습니다. 소스 코드 제출 내용: https://gerrit.libreoffice.org/#/c/54562/
Add and fixed missing Korean Hanja sound Updated Hangul/Hanja conversion dictionary on LibreOffice
ref1: 韓国の人名用漢字表のテキスト版 https://srad.jp/~yasuoka/journal/589283/
ref2: Proposal to add kKoreanName and kKoreanNameVariant to the Unihan Database https://www.unicode.org/L2/L2017/17084-korean-name-var.pdf
ref3: Libhangul’s hanja.txt(Hangul-Hanja conversion char&words dictionary) https://github.com/choehwanjin/libhangul/blob/master/data/hanja/hanja.txt
수정된 파일 비교: https://gerrit.libreoffice.org/#/c/54562/2/i18npool/source/textconversion/data/hhc_char.dic
LibreOffice Gerrit 화면 (QA완료) https://gerrit.libreoffice.org/#/c/54562/
다음의 링크는 기존 LibreOffice의 한글-한자 변환사전과 제가 수정한 한글-한자 변환 사전의 비교입니다.
This link is diff between LibreOffice’s hangul-hanja conversion dictionary file with existing errors (Left) and I fixed it(Right). https://www.diffchecker.com/sNeNdLEe
— — — — — — — — — — — — — –
한국 한자음(韓國漢字音)에 대해 참고한 내용은 다음과 같습니다.
韓国の人名用漢字表のテキスト版(한국의 인명용한자의 텍스트판) https://srad.jp/~yasuoka/journal/589283/
Proposal to add kKoreanName and kKoreanNameVariant to the Unihan Database https://www.unicode.org/L2/L2017/17084-korean-name-var.pdf
Libhangul’s hanja.txt(Hangul-Hanja conversion char&words dictionary) https://github.com/choehwanjin/libhangul/blob/master/data/hanja/hanja.txt
리브레오피스(LibreOffice)의 한글-한자(漢字) 변환사전의 내용 수정 및 적용 was originally published in LibreOffice Korean Team on Medium, where people are continuing the conversation by highlighting and responding to this story.