개인 사전 작성법(펌)

개인 사전 작성법(펌)

상호 9 411 2020.10.30 14:52

Ehnd 번역순서

input(원문)-전처리-번역엔진-후처리-output(역문)


ehnd폴더 내용

전처리필터(PreFilter_@~~~.txt)

사용자사전(UserDict_@~~~.txt)

후처리필터(PostFilter_@~~~.txt)

스킵레이어(SkipLayer_@~~~.txt)

환경설정(ehnd_conf.ini)


txt파일 인코딩 UTF-8




1.전처리필터(PreFilter_@~~~.txt)

원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1


이지트랜스가 인식하지 못하는 문자, 문장을 미리 바꿔주거나,

문장을 나눠야만 정상적인 번역이 될 때 주로 사용한다.


번역 전에 처리하는가 번역 후에 처리하는가 차이만 있고

전처리필터와 후처리필터는 구조가 100% 동일하다.


차수 : 처리 순서(숫자가 낮을수록 먼저 처리. 1,11,111이 있다면 1-11-111순서로 처리됨)

치환 : 문자를 A에서 B로 바꾸는 단순한 구조. 속도가 정규식에 비해 20배 이상 빠르다.

복잡한거 싫은 사람은 치환만 쓰는것을 강력히 권장함.

정규식 : ehnd내부의 정규식 문법에 따라 작동. 복잡할수록 속도가 느려진다.(최소20배, 경우에 따라 1000배 이상도 가능)


예시1)

コウゲキリョク (tab) 攻撃力 (tab) 777 (tab) 0

위 문장을 전처리필터에 넣고 저장하면


コウゲキリョクが上がった


'코우게키료크가 올랐다' 가

'공격력이 올랐다' 로 번역된다.


예시2)

面白い (tab) ##面白い (tab) 777 (tab) 0

면백있는,오모지로 -> 재미있다

일본어는 띄어쓰기가 없어서 히라가나 하나만 붙어도 간섭으로 인하여 번역엔진이 맛가는 경우가 있다.

그런 상황을 막기 위해 꿀도르사전에서는 문장을 나누기 위해 @@, ##를 사용한다.(@@는 공백x, ##는 공백o)




2.사용자사전(UserDict_@~~~.txt)

원문 (tab) 역문 (tab) 0상용어구/1명사 (tab) 속성


이지트랜스 번역엔진의 사용자사전에 반영되는 기능이다.

따라서 단순치환이 아니라 이지트랜스 번역규칙에 따라 번역이 될 수도 안될수도 있다.

명사는 이지트랜스 번역엔진과 맞물리게, 상용어구는 비교적 치환에 가깝게 강제적으로 번역된다.

하지만 번역이 그 순간엔 잘 되어도 앞으로 번역할 모든 문장에 잘 된다는 보장은 없다.

가급적이면 명사로 작성하고, 너무 짧은 단어는 등록하지 않는 것이 좋다.


꿀도르사전에서는 역문 뒤에 #N을 붙여서 사용하는 경우가 있는데


#N라고 있다 -> #N과 있다 // 인명 + といる


이처럼 꿀도르 후처리 필터와 연계되어 보정하는 역할을 한다.

따라서 인명을 작성할 때


원문 (tab) 역문#N (tab) 1


이와 같이 작성한다면 좀더 효과적인 번역이 가능하다.


속성의 경우 섬세한 번역을 위한 이지트랜스 엔진의 자체적인 기능이다.

아래와 같이 다양한 종류가 있는데 하나만 사용할 수도 있고 여러개 쓸수도 있고 사용하지 않아도 된다.

하나만 쓰는경우 QCT, 두개 쓰는 경우 QCTQNP, 3개 쓰는 경우 QCTQNPQHP 이런식으로 붙여서 적어주면 됨.

병원에게 가다 -> 속성 VPl(장소) 입력 -> 병원에 가다

이런식으로 사용할 수 있지만 대부분의 상황에서 거의 효과가 없다.


속성 종류

* 고유 명사

QCT : 도시(지명)명

QNP : 민족명

QHP : 병원(분야)명

QID : 산업(업종)명

QMS : 언론기관명

QLG : 언어명

QMU : 음악(곡조)명

QMM : 화폐명

QPN : 인명

QWK : 작품명

QNN : 국가명

QAA : 포유류

QAB : 조류

QAC : 어류

QAD : 파충류,양서류

QAE : 곤충류

QAF : 절지동물

QAG : 연체동물

QAH : 원생동물

QAL : 꽃이름(풀이름)

QAM : 과일명

QAN : 나무이름

QAO : 농작물명


* 유형 명사

VFn : 가구

VBl : 건축물

VSn : 광물

VTp : 교통수단

VNn : 국가

VSp : 그림

VFr : 기상관계

VQm : 남성

VRw : 놀이기구

VPe : 도구

VPa : 도료

VAm : 동물

VLt : 모사(모피)

VTw : 무기

VJw : 보석

VLu : 분비물

VIv : 세균

VDt : 세제

VMa : 소재

VPt : 식물

VGn : 신(성인)

VBp : 신체부위

VRy : 악기

VLq : 액체

VMd : 약품

VQw : 여성

VSs : 우주천문관계

VFd : 음식(음료)

VCp : 의복

VHn : 인간

VPl : 장소

VAc : 장신구

VEl : 전기기구

VCk : 주방기기

VSw : 집필물(기록물)

VGt : 집합(군집)

VMo : 채권(유가증권)

VBk : 책(도서)

VCm : 통신기기

VSt : 학습도구

VMy : 화폐


* 무형명사 (1)

URt : 권리

UTt : 기술

UGs : 기체

USo : 노래

UTs : 발화(언어수단)

UDr : 방향

UGu : 법죄

ULw : 법제

USm : 사상

UPp : 상&벌

UCr : 색상

UTh : 생각(사고)

UMn : 수단(방법, 제도)

USe : 시각(관망)

UMe : 시간

ULm : 억제(제한)

UAr : 예술활동

UHr : 음성(음향) / 청음(소리) 상태

UQf : 자격

UCl : 종교행위(수단)

URc : 지각(인지)

UAq : 직업(신분)

UTi : 질병

USu : 학문


* 무형명사 (2)

UYp : 가격고저

UFl : 감정

UYs : 강도

UXd : 거리

UXl : 광도(조명)

UYl : 길이

UXe : 난이도

UYm : 냄새(후각)

UXb : 대소(크기, 규모)

UYk : 두께

UYa : 맛(미각)

UYq : 면적(넓이)

UXw : 무게

UYr : 비율

UCr : 색상

UXs : 속도감

UXf : 양(다소)

UXt : 온도

UXg : 위치고저

UYi : 인간&동물의 내적 형용

UYh : 인간&동물의 외적 형용

UXm : 중요도(상세도)

UHr : 청음(소리) 상태

UYt : 촉감




3.후처리필터(PostFilter_@~~~.txt)

원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1


전처리필터와 번역엔진에서 처리되고

후처리필터에서 마지막 차수까지 처리되면 최종적인 역문이 나오기 때문에

처리과정을 몰라도 가장 쉽게 사용할 수 있다.

번역엔진에서 잘못 처리되는 단어들을 교정하는데 좋다.

ex. 팥고물 -> 앙, 우르후 -> 울프, 멋진 (분)편 -> 멋진 분


차수 : 처리 순서(숫자가 낮을수록 먼저 처리. 1,11,111이 있다면 1-11-111순서로 처리됨)

치환 : 문자를 A에서 B로 바꾸는 단순한 구조. 속도가 정규식에 비해 20배 이상 빠르다.

복잡한거 싫은 사람은 치환만 쓰는것을 강력히 권장함.

정규식 : ehnd내부의 정규식 문법에 따라 작동. 복잡할수록 속도가 느려진다.(최소20배, 경우에 따라 1000배 이상도 가능)


예시1)

왜냐하면[だって] (tab) 왜냐하면 (tab) 77777777 (tab) 0

후처리 필터에 넣고 저장하면


だって…チキンがおいしいから


'왜냐하면[だって]… 치킨이 맛있으니까' 가

'왜냐하면…치킨이 맛있으니까' 로 번역된다.




4.스킵레이어 파일(SkipLayer_@~~~.txt)

PRE/POST (tab) 스킵할 차수 (tab) 검색할 단어 (tab) 0치환/1정규식


전처리/후처리 필터에서 실행하지 않고 넘기고 싶은 차수가 있을 때 사용한다.


예시1)

PostFilter_@~~~.txt의 내용이 아래와 같고

틀어박여 (tab) 틀어박혀 (tab) 16410310 (tab) 0

틀어박였 (tab) 틀어박혔 (tab) 16410310 (tab) 0

틀어박이 (tab) 틀어박히 (tab) 16410310 (tab) 0

일천일백 (tab) 1100 (tab) 16410310 (tab) 0


SkipLayer_@~~~.txt 파일에 아래와 같다면

POST (tab) 16410310 (tab) 틀어박 (tab) 0


통장에 일천일백만이 틀어박였다 -> 통장에 1100만이 틀어박혔다

통장에 일천일백만이 들어왔다 -> 통장에 일천일백만이 들어왔다 // 변화없음


후처리필터에서 틀어박 이라는 단어가 매칭되면 해당 차수를 검색하고

매칭되지 않으면 해당 차수를 통째로 스킵한다.




5.전처리필터/후처리필터 옵션


옵션1. 보조검색문(_AUX)

원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1 (tab) _AUX:검색문


검색문을 비정규식으로 빠르게 찾아보고 있을 경우 해당 구문을 실행한다.

스킵레이어나 토글에 비해 사용하기 쉽고 필요하다면 토글, 스킵레이어와 함게 사용할 수 있다.


예시1)

4달러로 합시다 (tab) 사딸라로 합시다 (tab) 77777777 (tab) 0 (tab) _AUX:김두한

김두한 : 4달러로 합시다 -> 김두한 : 사딸라로 합시다


예시2)

맛있다|맛없다 (tab) 맛있다 (tab) 77777777 (tab) 0 (tab) _AUX:치약

맛있다|맛없다 (tab) 맛없다 (tab) 77777777 (tab) 0 (tab) _AUX:케이크


예시3)

_Skiplayer,_TGL 등 다른 옵션과 겸용하여 사용할 수 있다.

_SkipLayer (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1 (tab) _AUX:검색문



옵션2. 스킵레이어(_SkipLayer/_skipsub)

※SkipLayer_@~~~.txt 파일과는 완전히 별도의 기능이므로 주의.


_SkipLayer (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1

_skip_sub (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1


위의 스킵레이어가 작동할경우 아래의 스킵서브가 작동한다.

스킵레이어, 스킵서브는 여러개 붙여서 사용할 수 있고 다수의 스킵레이어 중 하나만 만족되면 아래의 스킵서브가 작동한다.(OR조건)


예시1)

_SkipLayer o _SkipLayer o 

_SkipLayer x _skip_sub o

_skip_sub o _SkipLayer x

_skip_sub o _skip_sub x


예시2)

_SkipLayer (tab) 김두한 (tab) _MATCH_CHECK (tab) 777 (tab) 0

_skip_sub (tab) 4달러로 합시다 (tab) 사딸라로 합시다 (tab) 77777777 (tab) 0



옵션3. 토글변수(_TGL)

_TGL (tab) _DECR:변수명 (tab) _ON/_OFF // 변수 선언

_TGL (tab) _ON/_OFF:변수명 (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1 // 구문이 실행될경우 변수 ON/OFF

_TGL (tab) _CONN:변수명 (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1 // 변수가 ON일 경우 구문 실행

_TGL (tab) _CONN:변수명 (tab) ON/OFF:변수명 (tab) 원문 (tab) 역문 (tab) 차수 (tab) 치환0/정규식1 // CONN에서 지정한 변수가 ON일경우 특정 변수 ON/OFF


전처리에서 특정 변수를 켜고 후처리에서 변수를 활용할 수 있으므로 필요하다면 제한없이 복잡한 계산식을 만들 수 있다.


예시1)

_TGL (tab) _DECR:exam1 (tab) _ON //변수의 초기값 ON

_TGL (tab) _CONN:exam1 (tab) 팥고물 (tab) 앙 (tab) 999 (tab) 0 //exam1 변수가 on일때 팥고물 -> 앙


Comments

팁 감사합니다.
상호 2020.10.31 01:38
다음에 한번 참고해서 수정해야겠네요
Kimas 2020.11.01 04:42
공부가 많이 되는군요..

감사합니다.
팁 감사합니다
이분들 모두 대단하시네 난 읽어도 모르겠움 ㅎㅎ ㅠㅠ
jjjgh 2020.11.07 02:59
되게 복잡하네요
여기에 고수분들 많으시네요
번호 제목 글쓴이 날짜 조회 추천
[팁] 텍스트 번역 프로그램 추천 댓글+22 라이킴 2020.11.23 1722 0
Syosetu 다운로드 / 자동 변역기 댓글+19 익명 2020.11.05 1330 3
게시판 주의사항 댓글+2 라이킴 2020.10.25 313 0
19 번역기 많이 쓰시는 분들께 좋은 소식 댓글+4 상호 02.16 250 0
18 Syosetu 다운로드 / 자동 변역기 v2 댓글+4 익명 01.14 455 1
17 다들 번역기 뭐 쓰시나요? 댓글+2 google_970408b8 01.09 217 0
16 이거 사용법이 뭔가요? 댓글+5 김민준 01.08 216 0
15 꿀도르 사용자 사전 추천 댓글+3 상호 2020.12.12 344 0
14 JTK 일본어 번역기 (안드로이드 어플) 댓글+5 하이얀 2020.12.11 658 1
13 번역기 쓰시는 분들 궁금한 게 있는데 댓글+4 kun811 2020.11.27 583 0
12 NovelUp.plus는 무슨 추출프로그램 사용하시나요? 댓글+3 수수한아이 2020.11.26 590 0
11 [팁] 텍스트 번역 프로그램 추천 댓글+22 라이킴 2020.11.23 1722 0
10 다들 번역하실 때 아네모네를 많이 이용하시나 보네요 댓글+6 라이킴 2020.11.21 678 0
9 반복문장 문제 팁? 댓글+4 Flare 2020.11.21 381 0
8 아네모네의 한가지 팁아닌 팁? 댓글+7 Flare 2020.11.21 536 1
7 Syosetu 다운로드 / 자동 변역기 댓글+19 익명 2020.11.05 1330 3
6 스크립트 해제법 댓글+9 윗분말씀대로 2020.11.04 337 0
열람중 개인 사전 작성법(펌) 댓글+9 상호 2020.10.30 413 0
Category
Facebook Twitter GooglePlus KakaoStory NaverBand