Loại hình dữ liệu quan trọng và khổng lồ
Phát biểu tại Đại hội đại biểu toàn quốc lần thứ nhất Hiệp hội Dữ liệu quốc gia ngày 22.3, Tổng Bí thư Tô Lâm nhấn mạnh: "Chúng ta đang bước vào giai đoạn bình minh của kỷ nguyên số, thời kỳ dữ liệu đã trở thành tài nguyên, tư liệu sản xuất quan trọng, trở thành ‘năng lượng mới’, thậm chí là ‘máu’ của nền kinh tế số".
Nghị quyết số 57-NQ/TW ngày 22.12.2024 của Bộ Chính trị về đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia cũng đã xác định rõ: dữ liệu là trung tâm của chuyển đổi số, là động lực quan trọng cho sự phát triển.
Vậy dữ liệu là gì?
Dữ liệu là thông tin dưới dạng ký hiệu, chữ viết, chữ số, hình ảnh, âm thanh hoặc dạng tương tự. Trong thế giới dữ liệu hiện nay, xuất bản chính là một loại hình dữ liệu quan trọng và khổng lồ (bên cạnh mỹ thuật, âm nhạc, điện ảnh, thông tin nhân khẩu học...). Đơn cử, Thư viện Quốc gia Việt Nam là một trong những trung tâm lưu trữ xuất bản phẩm lớn, hiện có hơn 2,5 triệu đơn vị tư liệu và bộ sưu tập số khoảng gần 10 triệu trang tài liệu.
Tại sao dữ liệu lại quan trọng và được xem là tài nguyên mới?
Khái niệm dữ liệu bắt đầu xuất hiện vào cuối thế kỷ XVIII. Dữ liệu được sử dụng với nhiều mục đích khác nhau: từ việc trị quốc cho đến cải thiện xã hội, từ ứng dụng trong chiến tranh cho đến áp dụng vào kỹ thuật và kinh doanh. Dữ liệu đang theo dõi chúng ta: thông tin cá nhân và các trao đổi hàng ngày trên các nền tảng xã hội cho phép đưa ra các phân tích về thói quen, dự đoán xu hướng và cung ứng sản phẩm, dịch vụ, tiện ích. Thậm chí, không hề ngẫu nhiên khi ai đó mua món quà tặng chính xác cho người yêu vào dịp 8.3 hay cho vợ hoặc chồng vào dịp kỷ niệm ngày cưới: nó đã được dự đoán trước bằng thuật toán dựa trên cơ sở dữ liệu của chính người đó.

Xuất bản là loại hình dữ liệu liên thông với xã hội và nhạy bén với xu hướng xã hội. Khi xã hội xuất hiện một nhu cầu, thậm chí mới chỉ manh nha, thì gần như đồng thời hoặc chỉ sau thời gian ngắn, trên thị trường sẽ xuất hiện loại sách vở tương ứng. Một mặt, nó đáp ứng nhu cầu của bạn đọc; mặt khác, nó được sử dụng để phân tích, đánh giá xã hội.
Cũng từ sách vở, tri thức lại được tiếp tục sinh ra, phát huy và kiến tạo thêm nhiều thành tựu tri thức mới, là cơ sở cho sự phát triển nhiều mặt của bất kỳ xã hội nào. Từ một cuốn sách có thể hình thành nên cả một hệ tư tưởng (như Tư bản của Karl Marx), một con đường giải phóng dân tộc (cuốn Đường Kách mệnh của Nguyễn Ái Quốc), một cách thức quản trị kinh doanh (cuốn Nhà quản trị hiện đại của Peter Drucker), một phương pháp giáo dục (cuốn Nhà trường và Xã hội của John Dewey hay 7 định luật giảng dạy của John Milton Gregory)…
Chính vì thế, xuất bản nên được coi là một trong những “mỏ” của thứ tài nguyên mới trong kỷ nguyên công nghệ hiện nay: tài nguyên dữ liệu.
3 loại tư duy mới, tạo đột phá cho ngành xuất bản
Các loại tài nguyên thiên nhiên như gỗ, đá, than, dầu mỏ… được khai thác bằng sức người và máy móc. Còn tài nguyên dữ liệu được khai thác bằng công nghệ, cụ thể là trí tuệ nhân tạo (AI). Cụ thể hơn, trong khoảng gần ba năm trở lại đây, khi nhắc đến AI, chúng ta ngay lập tức nói tới chatGPT. Tương tự như chatGPT, còn có các ứng dụng AI khác như Copilot, Gemini, Claude, DeepSeek, Grok… Chúng đều là các mô hình ngôn ngữ lớn. Mô hình ngôn ngữ lớn là mô hình học máy rất lớn, được đào tạo trước dựa trên lượng dữ liệu khổng lồ - chính là các văn bản và các mối quan hệ giữa các văn bản.
Ngành xuất bản hiện đại có thể được coi là ngành dữ liệu mà trong đó dữ liệu được tổ chức, sắp xếp, khai thác và kiến tạo bằng cách sử dụng AI hiệu quả. Làm chủ AI phải trở thành một kỹ năng cơ bản của kỷ nguyên mới, khi đó dữ liệu mới phát huy được tối đa hiệu quả, tạo ra những bước chuyển và đột phá của ngành xuất bản.
AI đang dần thay thế con người trong các việc mang tính lặp lại và thuần túy kỹ năng. Tức là nó có thể thay thế phần lớn công việc của những người làm xuất bản truyền thống, trong hầu hết các khâu: bản quyền, dịch thuật, biên soạn, trình bày, thiết kế… Tuy nhiên, AI chưa tiến hóa đến trình độ có cảm xúc và lý luận. Nhưng theo một số chuyên gia hàng đầu về AI, thời điểm AI đạt trình độ cao đang đến gần. Để làm chủ AI ngày càng thông minh hơn, con người phải hình thành tư duy mới - tương tự như khi con người thời đại nông nghiệp phải tạo lập não trạng tương thích khi chuyển sang thời đại công nghiệp.
Tư duy mới ấy trong ngành xuất bản nên dựa trên ba loại tư duy. Tư duy hệ thống để bao quát được bối cảnh xã hội. phân tích và giải quyết các mối quan hệ chằng chéo phức tạp của thực tế mà AI chưa đủ dữ liệu cũng như năng lực để xử lý do hạn chế của công nghệ phần cứng (công nghệ bán dẫn).
Tư duy phản biện để đánh giá đúng - sai, có đáng tin cậy hay không của những thông tin, giải pháp… mà AI cung cấp; để kiểm soát những nguy cơ đạo đức tiềm tàng mà AI vô nhân tính có thể mang lại.
Tư duy công nghệ để biết nắm bắt và ứng dụng kịp thời những thành tựu mới về AI và khoa học dữ liệu, giúp tối ưu hiệu suất lao động và tạo ra những giá trị mới mẻ, thậm chí là đột phá.
Và để hiện thực hóa được ba loại tư duy nêu trên, trước sự đổi mới như vũ bão của làn sóng công nghệ hiện nay, người làm xuất bản nói riêng và con người nói chung phải học tập không ngừng nếu không muốn bị lạc hậu, trở thành những người “mù chữ mới”. Học tập suốt đời chính vì thế mà trở thành bản năng sinh tồn của con người kỷ nguyên mới, nếu như họ không muốn bị đào thải bởi những người biết sử dụng AI, biết học tập không mệt mỏi.