Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

컴퓨터 번역기 알고리즘 분석을 통한 자동번역기 연구

No description
by

민정 권

on 23 December 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of 컴퓨터 번역기 알고리즘 분석을 통한 자동번역기 연구

컴퓨터 번역기
알고리즘 분석을 통한
자동번역기 연구

권민정, 김서희, 현나은
목차
0. 연구동기

1. 자동번역기에 대한 선행조사

2. 번역 언어에 대한 탐구
1)영어
2)한국어 및 중역언어

3. 자동번역기의 문제점 탐구

4. 자동번역기의 해결방안 탐구

5. 결론 및 느낀점
0. 연구동기
번역의 부자연스러움, 어순불일치로 인한 문제점 발생
이로 인한 해결방안 탐구
1. 자동번역기에 대한 선행조사
번역기의 작동방식 :
알고리즘
분석을 통한 규칙탐구

번역기의 기계속성 :
빅 데이터, 통계적 기계번역

연구한 번역기 : 구글 번역기 그 외 다수

연구한 번역언어:한글-영어 위주의 정확한 번역
알고리즘
이란?

어떤 문제의 해결을 위하여 입력된 자료를 토대로 하여 원하는 출력을 유도하여 내는 규칙의 집합
2. 번역 언어에 대한 탐구
1) 영어
인도유럽어족

SVO 의 어순

인간 주어 중심적

명사선호 표현
2) 한국어 및 중역언어
우랄알타이어족

SOV의 어순

특징과 어순이 비슷

지리적 근접성 영향

일본어 및 타밀어
3. 자동번역기의 문제점 탐구
4. 자동번역기의 해결방안 탐구
5. 결론 및 느낀점
★구글코리아에 메일보내기
1) 한-영 번역의 문제점
한국어는
선행사

관계대명사
가 존재하지 않음
관형사절의
수식 관계
가 불명확함
한국어의 주어-목적어-동사의
어순
이 영어와 다름
번역기 프로그램에
내재되어 있는 정보
의 부족

2) 영-한 번역의 문제점
콤마
(,)나
마침표
(.)의
유무
에 따라 변역결과가 달라짐
명사
중심 표현과
동사
중심 표현
인물
중심 표현과
상황
중심 표현

1) 사용자가 할 수 있는 방법

중역언어
(일본어,러시아어) 사용
빅 데이터
를 가지고 있는 번역 사이트에 접속
회화체나 대화체 보다는
형식적인 문장
사용
긴 문장은 가급적이면
짧게 끊어
나누어 해석
문장부호
(. , ? !)를 문장의 마지막 부분에 꼭 첨부
관계대명사의 사용을
접속사+대명사
로 대체
고유 명사를 단순한
대명사

단어

치환
중의적
인 표현을 피한다.
주어, 목적어의
생략
을 피한다.
단어수정(
대체유의어
사용)를 사용
사용자의 학식 수준에 따라 사용
부사

비교적 접속사
를 사용한다.
<
사용자
위주>
<
제공자
위주>
<
번역기
자체>
3) 번역기 자체의 번역 품질을 높이는 방법

사전재배열
(Pre-reordering)
번역 메모리 툴
을 효과적으로 활용함으로써 동일원고나, 관련원고 사이에 있어서 동일문장이나 유사문장매치 세그먼트와 같은 번역 재활용을 철저히 행한다.
기계번역 외에
사용자 참여 번역
함께 시행
투자비용을 낮출 수 있는 통계적 기계번역과 더 나은 품질이 반영된 규칙적 기계번역을 병행하여
제3의 번역 방법
을 찾는다.

2) 번역 제공자의 프로그램 개선 방법

딥 러닝 기술
이용
(다량의 데이터 속에서 핵심적인 내용 또는 기능을 요약)

일부 접미사만 분류 하는 것이 아닌
한글 음절 11,172개
반영 되어있는 유니코드 인코딩 방법을 번역기에 반영
어휘 사전 즉, 빅 데이터를 반영하는 방법과 사전 탐색 방법, 탐색 횟수
최소화
를 병행한다.
기계번역 외에
전문번역, 창조적 번역을 반영
한다.
번역 결과를 제공할 때 전문 용어나 맥락등을 고려할 수 있는
범주 카테고리를 구성
한다.(systran)
문제점에 대한 해결방안을 스스로 만들어 제시한다는 점에서 일상생활에서의 문제점을 해결함

언어뿐만 아니라 번역기와 연관된 과학기술과
수학 영역에서의 지식을 습득함

어떠한 불편한 상황에 있어서 불만만 가지지말고 그 문제점에 대해 고민하고 탐구하여 그 상황을 개선하기 위한 방법들을 탐색하는 자세를 가짐

Full transcript