Tìm kiếm PhanVien.Com Web
Download PhanVien.Com Toolbar
Danh mục thông tin

Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Những công cụ dịch thuật tự động đã xuất hiện từ lâu, và các kỹ thuật mới đang giúp đẩy mạnh hiệu suất hoạt động của chúng. Tuy nhiên, chất lượng vẫn còn là vấn đề nan giải.
Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng.

Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Bạn vào trang Language  Tools của Google  (http://www.google.com/language_tools) và thử làm như sau: Đánh vào ô Translate text câu hỏi  “Automated language  translation – is it an idea whose time has come?”(Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không?) và cho chương trình  dịch câu hỏi  đó sang tiếng Pháp. Tiếp theo, dịchkết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đứccó được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language  translation automate – is it an idea, from which the time came?” (Dịch thuật tự động hóa – Nó có là một ý tưởng mà thời gian  đến từ đó?).

Làm lại giống như vậy với câu “Reboot your computer  and try again.” (Khởi động lại máy tính  của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng  là “Their computer  and attempt still again  load.”(Máy tính của họ và nỗ lực vẫn còn nhập vào lần nữa.) Ôi trời ! Đúng là“tam sao thất bản”!!! Có lẽ bạn sẽ thật sự ngán ngẫm nếu như những sáchhướng dẫn sử dụng thiết bị có nhiều ngôn ngữ  được dịch theo kiểu nhưthế này.

Tuy vậy, công bằng mà nói thì các công cụ dịch thuậtcũng có những hỗ trợ tích cực ở một số mặt nào đó. Và các nhà nghiêncứu cho biết những cách tiếp cận mới sẽ mang lại nhiều cải thiện vềcách thực hiện cho những công cụ dịch thuật.

Cập nhật cơ sở dữ liệu 

Hãngxe hơi Ford  đã bắt đầu sử dụng phần mềm  dịch thuật (machinetranslation) từ năm 1998, và đến nay hãng này đã dịch được năm triệucâu hướng dẫn  lắp ráp từ tiếng Anh  sang tiếng Tây Ban Nha, Đức, Bồ ĐàoNha và tiếng Tây Ban Nha  của người Mexico. Các sách hướng dẫn  lắp rápbằng tiếng Anh  được cập nhật mỗi ngày, và những bản dịch của chúng –khoảng 5.000 trang một ngày – được nhanh chóng chuyển đến các nhà máycủa Ford  trên khắp thế giới.

Nestor Rychtyckyj, chuyên gia  về trí tuệ nhân tạo (Artificial Intelligence – AI) của hãng Ford, nói: “Bạn không thể làm toàn bộ công việc  này một cách thủ công được.”

Hãngxe hơi này sử dụng phần mềm  Enterprise  Global Server  của SystranSoftware, một công ty  chuyên cung cấp các phần mềm  dịch thuật có trụ sởở San Diego, bang California. Bên cạnh đó, các kỹ sư của Ford  cũng tựviết một chương trình  AI để chuyển ngữ những câu hướng dẫn  thuộc vềchuyên môn ở cấp độ cao một cách chính xác  và rõ ràng. Mỗi một câuhướng dẫn đều được lưu trữ  vào cơ sở dữ liệu  để dùng cho việc dịchthuật.

Hãng Ford  cũng phải phát triển những từ điển thuật ngữchuyên ngành xe hơi. Theo Rychtyckyj, duy trì những từ điển như thế dễdàng hơn việc tìm kiếm  một chuyên gia  dịch thuật thông thạo các thuậtngữ. Ông nói: “Hầu hết những nỗ lực của chúng tôi xây dựng  cácbảng thuật ngữ, và thường xuyên thay đổi chúng. Kết quả dịch thuật củabạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”

Phầnmềm của công ty  Systran sử dụng một kỹ thuật  đáng tin cậy gọi là dịchtheo quy tắc (rules-based translation). Những hệ thống  như thế sử dụngnhững từ điển song  ngữ kết hợp với cơ sở dữ liệu  về cách dùng từ và cácquy tắc văn phạm. Các trình dịch thuật thương mại  thường được bổ sungbằng các bảng thuật ngữ, hoặc những cơ sở dữ liệu  lưu trữ  những câuhoặc đoạn văn mẫu đã được dịch sẵn (translation memory). Những phần bổsung này thường do người sử dụng  lập ra trong quá trình dịch thuật. Nhờvậy, phần mềm  dịch thuật có thể đưa ra những từ hoặc câu dịch chính xáchoặc gần đúng nhất so với từ hoặc câu gốc để người dịch dễ dàng xemlại.

Huấn luyện phần mềm

Dịchthuật theo kiểu thống kê  (statistical machine translation) là một kỹthuật mới nhưng chưa được sử dụng rộng rãi. Kỹ thuật  này sử dụng nhữngvăn bản gốc và bản dịch của chúng để “huấn luyện” phần mềm. Theo thờigian, những hệ thống  này sẽ “học” được cách tạo ra một bản dịch tốt,rồi dùng phép tính xác suất và thống kê  để chọn ra một từ hoặc cụm từgần đúng nhất dựa trên ngữ cảnh.

Các hệ thống  thống kê  đòi hỏiphải có rất nhiều văn bản  để huấn luyện các thuật toán, nhưng chúngkhông cần các quy tắc văn phạm, từ điển song  ngữ hoặc translationmemory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnh cácquy tắc đó theo thời gian.

Hãng Google  sử dụng phần mềm dịchtheo quy tắc của công ty  Systran, nhưng họ cũng phát triển những hệthống dựa trên thống kê  của chính họ để dịch từ tiếng Anh  sang tiếngẢ-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gia  nghiên cứuFranz Josef Och của Google, những ngôn ngữ  này rất khó cho các phần mềmdịch thuật vì chúng khác với các ngôn ngữ  Tây phương có gốc là tiếngLatin bình dân (Vulgar Latin).

Trong nhiều năm qua, hãngMicrosoft đã đưa một phần mềm phân tích  cú pháp dựa trên quy tắc vănphạm vào trình soạn thảo  văn bản  Word của họ. Gần đây, hãng này lại kếthợp các translation memory, các phần mềm dịch thuật dựa trên quy tắc vàthống kê với sự hỗ trợ của con người  để dịch các văn bản  cho cơ sở dữliệu về thông tin  hỗ trợ khách hàng  của họ. Steve  Richardson, một nhànghiên cứu cao cấp của Microsoft, nói: “Khuynh hướng mới trong cộngđồng các nhà nghiên cứu  là xem con người  có thể kết hợp những kỹ thuậtthuần túy về thống kê  này với một số kiến thức  về ngôn ngữ  ra sao.”

Khi được hỏi là sẽ có những đột phá trong việc dịch thuật không, ông trả lời: “Nhữngđột phá đã xuất hiện trong quá trình nghiên cứu. Trên phương diện thựchành, sẽ có những đột phá trong việc tạo ra những hệ thống  được tíchhợp vào quá trình hoạt động  của doanh nghiệp.”

Xu hướngtrong tương lai là kết hợp các cơ sở dữ liệu  lưu trữ  những câu hoặcđoạn văn mẫu đã được dịch sẵn với các phần mềm dịch thuật dựa trên quytắc hoặc thống kê, hoặc cả hai. Những hệ thống  lai tạo như thế sẽ trởnên tinh vi và phức tạp hơn.

Tuy nhiên, những hệ thống  dịchthuật hiện nay chưa thể đưa ra những bản dịch có chất lượng  cao như lànhững dịch giả “siêu đẳng”, đặc biệt đối với những văn bản  sử dụng ngônngữ bình dân. Theo Rychtyckyj của hãng Ford, những hệ thống  lai tạo trởnên thông minh  như thế nào không là vấn đề gì cả, chất lượng  dịch thuậtphụ thuộc vào việc xây dựng  ngôn ngữ  gốc một cách chuẩn xác.

Quy trình dịch thuật nói chung có hai công đoạn chính:

- Phân tích  nguyên bản trong ngôn ngữ  gốc để “hiểu” thật rõ tác giả  “muốn nói” gì.

- Tái lập ý nghĩa mà tác giả  muốn chuyển tải trong ngôn ngữ  đích để có được một văn bản  tương đương với nguyên bản.

Thoạtnhìn thì quy trình  này có vẻ đơn giản nhưng đằng sau nó là cả một quátrình nhận thức phức tạp. Để “giải mã” ý nghĩa của văn bản  gốc một cáchchính xác, dịch giả phải phân tích  và diễn giải tất cả các đặc tính củanó. Đây là một quá trình đòi hỏi một kiến thức  sâu rộng về văn phạm,ngữ nghĩa, cú pháp, thành ngữ… của ngôn ngữ  gốc, cũng như văn hóa củatác giả văn bản  đó. Đồng thời, dịch giả cũng phải có một kiến thứctương tự như thế về ngôn ngữ  mà họ sẽ chuyển đổi.

Vì vậy,thách thức đối với các phần mềm dịch thuật là lập trình như thế nào đểmáy tính có thể “hiểu” một văn bản  như là con người.
Tìm bài viết khác
Theo TBVTSG
Updated: 01/03/2008 | Views: 688 | Comments: 0

Comments - Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Hiện tại chưa có bình luận nào về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng!

Bạn có ý kiến gì về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng này? Hãy gởi suy nghĩ, bình luận, đánh giá, lời khuyên ... của bạn về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng bạn tại đây.

Other articles

Similar Articles Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng

Older than Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng in Kiến Thức Tin Học Cơ Bản

Newer than Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng in Kiến Thức Tin Học Cơ Bản

Recently Published - Kiến Thức Tin Học Cơ Bản
Day ao thuat
Latest Comments in Kiến Thức Tin Học Cơ Bản
By Cuong. Tải phần mềm USB DISK SECURITY 5.0.0.35- Bo tien ich toan dien cho cac thiet bi luu .....
By thaingoc. xp va linux co the cung chay tren mot HDD that khong the tin duoc, that hay , nhung em .....
By nguyen manh dien. Wedding Album Maker toi lam bang phan mem nay tai sao xuat file ra khong the xuat duoc .....
By Hien. Mình down về rồi mà không open được là vì sao?Có đòi hỏi máy tính .....
By buivanlong. tang toc sao day...
By Nguyen DEuc Tuan. Rat tot, cam on cac ban...
By Mạnh Hùng. cảm ơn bạn nhiều nhé, giờ mới biết cái vụ này, mong rằng bạn sẽ .....
By naminvietnam. Toi nghi la nguoi uplink chet toi roi, neu ban nao can thi xuong tra so Nam tao nhe...
By LE VAN BINH. Toi bi mat driver o DVD+-RW...
By ngoc duong. co ai lay lai cau hoi bi mat cua nick chat tui dc hok neu dc thi pm wa dum tui nha o nick .....
By Nguyễn Triều Ấm. Cho mình xin phần mềm thực hành đánh máy nhanh trên 10 ngón nhé!!Xin chân .....
By linh quy. anh chị ơi cho em hỏi tính năng drop shadow là gì vậy ạ. em xin cảm ơn....
By thaitientri. Download về máy rất dễ, nhưng khi giải nén không có password kèm theo thì .....
By minhhang241184. Thanks vì link download, tuy nhiên việc kg cung cấp pass giải nén thì trở .....
By 25041968. phần mềm dó rất hay vì ko phải ai cũng đủ kinh tế đẻ nâng câp...
Most Comments in Kiến Thức Tin Học Cơ Bản
Monthly Most Views - Kiến Thức Tin Học Cơ Bản
  English Tiếng Việt 
Bạn đang xem bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng được gởi trong chủ đề Kiến Thức Tin Học Cơ Bản - Công Nghệ Thông Tin. Bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng này được lưu trên Server thành hai bản: Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng có dấuPhần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng không dấu. Bạn có thể gởi ý kiến bình luận, đóng góp về bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng này tại phần gởi bình luận ở cuối nội dung bài viết. Lưu ý nội dung của bài viết Phần mềm dịch thuật trực tuyến: Cần quan tâm đến chất lượng này có thể không còn phù hợp với thời điểm hiện tại. Nếu phát hiện điều này, xin bạn báo cho BQT biết để gỡ bỏ nó.
Home Page | Privacy | Contact | Friend Links | Search | Sitemap | Up
Copyright © 2008 PhanVien.Com . All rights reserved.