Những trao đổi của ông Lê Vũ Khánh, chuyên gia dịch thuật, về việc xây dựng công cụ dịch thuật trên TGVT B số tháng 9/2009 đã gợi mở một đề tài được các nhà ngôn ngữ học, chuyên gia CNTT... bàn luận sôi nổi. Chúng tôi trích đăng dưới đây một số ý kiến nổi bật
Phạm Văn Bảy, nguyên Chủ tịch nhiệm kỳ I Hội Tin học TP.HCM:
Không nên để trễ nữa!
![]() |
|
Ông Phạm Văn Bảy |
Bài trao đổi với ông Lê Vũ Khánh về việc dịch thuật với sự hỗ trợ của CNTT là một vấn đề quan trọng mà ai quan tâm đến hội nhập quốc tế, đến tiếng Anh và tiếng Việt đều rất bức xúc vì chúng ta chưa ý thức khởi đầu vấn đề khá mới này. Ông Lê Vũ Khánh với kinh nghiệm lâu năm, đã là một trong những người đầu tiên khơi mào vấn đề.
Theo tôi, phải bắt đầu từ những cái cơ bản nhất.
Trước hết phải sử dụng đạt chuẩn tiếng Việt trong giao tiếp, trao đổi
thông thường, sau đó mới ứng dụng trong môi trường CNTT. Để cải thiện
vấn đề này, phải có cơ quan có đủ thẩm quyền và chuyên môn chủ trì, tổ
chức tham khảo ý kiến rộng rãi nhiều chuyên gia ngôn ngữ và quần chúng
trong và ngoài nước. Từ đó, quy tụ các chuyên gia thuật ngữ, từ điển về
CNTT thành một tiểu ban để nghiên cứu đưa ra giải pháp tối ưu thử nghiệm
một thời gian, sau đó quyết định thực hiện. Quyết định này bắt buộc tất
cả, từ báo chí đến giáo dục... đều phải tuân thủ vì trong ngôn ngữ,
nhiều khi chỉ thói quen là quyết định. Chỉ cần thực hiện vài năm, việc
sử dụng ngôn ngữ sẽ đi vào chuẩn mực, tạo điều kiện ứng dụng các công cụ
CNTT hỗ trợ dịch thuật. Thêm một yếu tố rất cần thiết, theo tôi là phải
cùng vì lợi ích chung. Đồng thời, cần chú trọng nghiên cứu phân tích
ngữ pháp. Đây là vấn đề khá phức tạp vì ngôn ngữ phải hình thành từ rất
lâu theo sự phong phú và đa dạng của tiếng nói.
Ứng dụng CNTT
trong dịch thuật, điều cơ bản là phải xác định tương đối mức độ chính
xác của phần mềm (PM) dịch thuật: 80, 90 hay 95% kết quả sẽ khác nhau
rất xa. Vì vậy, những công cụ này cũng chỉ mang tính hỗ trợ mà thôi.
Ý kiến của ông Lê Vũ Khánh là lời nhắc nhở chúng ta về một vấn đề rất lớn và rất đặc thù của CNTT. Không nên để trễ nữa.
TS Dương Kỳ Đức, Tổng thư ký Hội Ngôn ngữ học (NNH) Việt Nam.
Nên sử dụng kết quả nghiên cứu của ngành NNH
![]() |
|
Ông Dương Kỳ Đức |
Phải thừa nhận thực tế là ngành NNH ít tham gia vào
các hoạt động của ngành CNTT bởi những lý do cả chủ quan lẫn khách quan.
Tuy nhiên, trong bối cảnh mà công nghệ dịch thuật bắt đầu bùng nổ thì
ngành NNH tất yếu phải chủ động hơn. Các công cụ hỗ trợ dịch thuật từ
tiếng nước ngoài sang tiếng Việt dẫu sao vẫn dễ thực hiện. Nhưng để dịch
theo chiều ngược lại thì vấn đề sẽ chỉ thực hiện được nếu như các
chuyên gia CNTT biết tận dụng các kết quả nghiên cứu của ngành NNH. Để
đi đến được sự hội tụ đó, Hội Ngôn ngữ học Việt Nam cũng sẽ tăng cường
thêm các mối quan hệ với ngành CNTT và cũng sẵn sàng mở rộng cửa để đón
nhận sự tham gia của các chuyên gia tin học, đặc biệt là những người đã
và đang thực hiện những sản phẩm liên quan đến NNH. Ngược lại, ngành NNH
cũng phải tích cực hơn trong các hoạt động của ngành và mong được xã
hội quan tâm.
Tôi rất hoan nghênh đề xuất của hội Trí thức
KH&CN Trẻ Việt Nam cho việc xây dựng chiến lược quốc gia CNTT-TT
giai đoạn sau 2010 là phải quan tâm đến đòi hỏi tối thiểu của quốc gia
(IT for Minimum) đó chính là về NNH.
Ông Nguyễn Quan Sơn, Kiến trúc sư trưởng Công ty Cổ phần Truyền thông Tinh Vân:
Còn nhiều thách thức
![]() |
|
Ông Nguyễn Quan Sơn |
Hiện nay công nghệ dịch tự động chủ yếu đang được
phát triển theo hai hướng: Dịch thống kê và kết hợp giữa dịch thống kê
với dịch dựa trên luật chuyển đổi. Ưu điểm của dịch thống kê là bản dịch
gần với ngôn ngữ tự nhiên, câu dịch có độ trau chuốt cao. Nhược điểm là
để bản dịch có chất lượng tốt đòi hỏi phải có tập ngữ liệu rất lớn và
đã được xử lý. Phương pháp thống kê có chất lượng dịch không cao với
những câu dài, cấu trúc phức tạp. Phương pháp kết hợp khắc phục được
những nhược điểm nói trên của phương pháp dịch thống kê, tuy nhiên xây
dựng một hệ thống như vậy phức tạp và tốn nhiều công sức hơn.
Việc
xây dựng hệ thống dịch tự động tiếng Việt còn đang gặp nhiều trở ngại
do kho ngữ liệu chưa đủ lớn và chất lượng chưa đủ tốt để áp dụng các
phương pháp thống kê, các công cụ cơ bản của một hệ thống xử lý ngôn ngữ
tiếng Việt như gán nhãn từ, phân tích cú pháp… còn rất hạn chế, chủ yếu
mới là các nghiên cứu mang tính thử nghiệm. Công ty Tinh Vân hiện có
phát triển công cụ dịch tự động (Anh – Việt) có tên
DAVIT(http://dich.xalo.vn), theo hướng kết hợp giữa dịch thống kê và
dịch dựa trên luật chuyển đổi. Hướng phát triển kết hợp (thống kê và
luật chuyển đổi) của Davit cho phép áp dụng được những thành tựu mới
trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên, đồng thời không
đòi hỏi phải có sẵn kho ngữ liệu song ngữ lớn như hướng dịch thống kê
thuần túy.
TS Lê Khánh Hùng, nguyên Trưởng phòng Công nghệ Tri thức và PM (Softex), Viện Ứng dụng Công nghệ:
Công nghệ dịch thuật không thể so với phiên dịch viên
![]() |
|
Ông Lê Khánh Hùng |
Công cụ dịch thuật không thể so với các phiên dịch cao cấp, chuyên nghiệp. Hiệu quả của công cụ dịch thuật là dịch một khối lượng tài liệu lớn trong một thời gian ngắn. Tất nhiên, để có được kết quả như mong muốn thì vẫn cần con người xử lý sau khi PM đã xử lý sơ bộ.
Đầu tư công nghệ dịch thuật tốn kém nhiều công sức và tiền bạc. Tuy nhiên, trong lúc chưa thu được tiền thì lại nhận được ngay những ý kiến không hài lòng về chất lượng, làm cho thành quả của nó buộc phải có điểm dừng nhất định. Vì thế, thay vì tiếp tục đầu tư để hoàn thiện EV Tran, Softex đã chuyển sang hướng mới là xây dựng từ điển đa ngữ. Sản phẩm này cũng sắp hoàn thành để đưa ra thị trường và hy vọng sẽ là bước tiến mới không chỉ giữa tiếng Anh và tiếng Việt mà còn với nhiều ngôn ngữ khác.
Nguồn: Baomoi.com
Tags: dich thuat, dịch thuật

































