Sáng ngày 06/8/2018, Viện nghiên cứu Châu Phi và Trung Đông cùng với Hội Trí thức Khoa học và Công nghệ trẻ Việt Nam đã tổ chức Tọa đàm khoa học "Công nghệ trong hỗ trợ dịch thuật và nghiên cứu khoa học". PGS.TS Lê Phước Minh, Viện trưởng Viện nghiên cứu Châu Phi và Trung Đông kiêm Phó Chủ tịch Phụ trách Hội Trí thức Khoa học và Công nghệ Trẻ Việt Nam đã tham dự tọa đàm.
Cần có công cụ dịch thuật do trong nước sáng tạo
Ông Lê Phước Minh cho biết, dịch thuật đang là vấn đề được những người làm khoa học quan tâm. Nhiều thuật ngữ mất rất nhiều thời gian để có thể chuyển ngữ sang tiếng Việt nhưng không được số hóa. Điều này khiến việc tiếp cận đến các bản dịch của các nhà khoa học trước đây gặp khó khăn. Trong trường hợp không tìm được bản dịch, những người làm khoa học sau này phải nghiên cứu và dịch lại các thuật ngữ mà thế hệ trước đã từng dịch. Không chỉ tốn thời gian, bản dịch mới nhiều khi không tốt như các bản dịch trước đây.
"Nhiều chuyên gia từng dịch được nhiều tác phẩm hay. Nhưng khi chuyên gia về hưu thì tri thức của họ cũng về hưu theo. Cần làm cách nào đó để tri thức ấy phải ở lại viện nghiên cứu. Sau đó phải sẻ dữ liệu để các thế hệ sau không dịch thuật lại những câu chữ mà người trước đã làm" – ông Lê Phước Minh nói.
Thực tế, 80% thời gian dịch thuật thường chỉ dịch lại những câu đươn giản và không cần tới người giỏi chuyên môn. Theo PGS. TS Nguyễn Ái Việt, Viện trưởng Viện Công nghệ thông tin (Đại học Quốc gia Hà Nội), để tăng tốc độ dịch thuật, các đơn vị thường chia nhỏ tác phẩm để nhiều người cùng tham gia dịch. Điều này khiến cho văn phong văn bản sau khi dịch không thống nhất.
Bên cạnh đó, dịch thuật không chỉ đơn giản là chuyển ngữ mà còn phải bảo đảm người đọc văn bản dịch hiểu được ý nghĩa của các tác phẩm. Muốn dịch được thành ngữ, người dịch phải tìm đọc điển tích, điển cố sau đó mới dịch và chau chốt lại câu văn. Việc này càng tốn nhiều thời gian hơn.
"Sẽ có người nhắc đến Google và cho rằng máy dịch không tốt. Thực ra Google dịch như vậy là tốt và sẽ càng tốt hơn mỗi ngày với sự đóng góp của cộng đồng. Nhưng Google sẽ mãi mãi không dịch tốt bằng con người. Trong 10 năm qua, tôi đã nghiên cứu và phát triển phần mềm dịch. Các bản dịch trong phần mềm này được đóng góp bởi các chuyên gia. Do đó, trong các chuyên ngành, độ chính xác cao hơn Google tới 50%" – ông Nguyễn Ái Việt nói.
PGS. TS Nguyễn Ái Việt cho biết, 5 chuyên ngành mà phần mềm BOCOHAN dịch tốt hơn Google bao gồm: y dược, công nghệ thông tin, tài chính, luật, thông tin đối ngoại. Dự trên mức độ cấp thiết mà ông và các công sự đã xây dựng cơ sở dữ liệu trước. "Khi chuẩn bị đăng ký với Bộ Công thương, Bộ Ngoại giao đã bày tỏ sự quan tâm với phần mềm và muốn có mảng thông tin đối ngoại. Sau này, Cục Thông tin đối ngoại thuộc Bộ Thông tin và Truyền thông được thành lập cũng muốn dịch chính xác các tài liệu về Hoàng Sa và Trường Sa" - PGS. TS Nguyễn Ái Việt kể lại.
Có thể ứng dụng thêm các công nghệ 4.0 để tạo hệ tri thức Việt số hóa
PGS.TS Huỳnh Quyết Thắng, Phó Hiệu trưởng Trường Đại học Bách khoa Hà Nội đánh giá phần mềm dịch thuật có tiềm năng ứng dụng rất cao trong đời sống, đặc biệt khi ứng dụng thêm các công nghệ 4.0.
"Nếu chúng ta có một kho tri thức như vậy và do các chuyên gia đóng góp thì sinh viên tham khảo nhanh hơn, tìm hiểu được các bài viết bằng tiếng Việt và ngôn ngữ gốc nhanh hơn. Ngược lại, chính sinh viên cũng đóng góp thuật ngữ mới trong quá trình tìm hiểu. như vậy, tri thức chia sẻ rất nhanh. Để làm được điều đó, phải tóm tắt được văn bản, tìm kiếm văn bản liên quan,… Lúc này, sử dụng công nghệ mới như big data, AI (trí tuệ nhân tạo) là phù hợp" – ông Huỳnh Quyết Thắng nói.
Theo ông Huỳnh Quyết Thắng, ở cấp độ cao hơn, phần mềm dịch thuật có thể giúp các nhà khoa học trong việc đọc nhanh tài liệu, xây dựng hệ tri thức Việt số hóa.
"Wikipedia là một cây tri thức khổng lồ, có tất cả các thuật ngữ trên thế giới được định danh đầy đủ. Trong lĩnh vực công nghệ thông tin, chúng ta có thể đóng góp tri thức để ra những thuật ngữ tương ứng. Chỉ cần câu trúc theo hình cây thì có thể đóng góp được cho Wikipedia. Các thuật ngữ rời rạc nhưng có liên quan đến nhau hoàn toàn có thể được hệ thống liên kết vào nối với nhau" – ông Huỳnh Quyết Thắng giải thích.