Công cụ AI của Google xác định các yếu tố di truyền gây ung thư

Google đã công bố DeepSomatic, một công cụ AI có thể xác định các đột biến liên quan đến ung thư trong trình tự gen của khối u một cách chính xác hơn.

Ung thư bắt đầu khi các cơ chế kiểm soát sự phân chia tế bào gặp trục trặc. Việc tìm ra các đột biến di truyền cụ thể thúc đẩy sự phát triển của khối u là điều cần thiết để tạo ra các kế hoạch điều trị hiệu quả. Các bác sĩ hiện nay thường xuyên giải trình tự bộ gen của tế bào khối u từ các mẫu sinh thiết để đưa ra các phương pháp điều trị có thể nhắm mục tiêu vào cách một loại ung thư cụ thể phát triển và lây lan.

Được công bố trên Nature Biotechnology, công trình này giới thiệu một công cụ sử dụng mạng thần kinh tích chập để xác định các biến thể di truyền trong tế bào khối u với độ chính xác cao hơn các phương pháp hiện tại. Google đã công bố rộng rãi cả DeepSomatic và bộ dữ liệu huấn luyện chất lượng cao được tạo ra cho nó.

Thách thức của các biến thể soma

Di truyền học ung thư rất phức tạp. Mặc dù việc giải trình tự bộ gen có thể tìm thấy các biến thể di truyền gây ung thư, nhưng việc phân biệt các biến thể thực sự với lỗi giải trình tự là khó khăn và đây chính là lúc một công cụ AI sẽ hỗ trợ đắc lực. Hầu hết các bệnh ung thư được thúc đẩy bởi các biến thể ‘soma’ mắc phải sau khi sinh, hơn là các biến thể ‘dòng mầm’ được thừa hưởng từ cha mẹ.

Đột biến soma xảy ra khi các yếu tố môi trường như tia UV làm hỏng DNA, hoặc khi các lỗi ngẫu nhiên xảy ra trong quá trình nhân đôi DNA. Khi các biến thể này làm thay đổi hành vi bình thường của tế bào, chúng có thể gây ra sự nhân lên không kiểm soát, thúc đẩy sự phát triển và tiến triển của ung thư.

Việc xác định các biến thể soma khó hơn so với việc tìm các biến thể di truyền vì chúng có thể tồn tại ở tần số thấp trong tế bào khối u, đôi khi ở mức thấp hơn cả tỷ lệ lỗi giải trình tự.

DeepSomatic hoạt động như thế nào

Trong môi trường lâm sàng, các nhà khoa học giải trình tự cả tế bào khối u từ sinh thiết và tế bào bình thường từ bệnh nhân. DeepSomatic phát hiện sự khác biệt, xác định các biến thể trong tế bào khối u không di truyền. Những biến thể này tiết lộ điều gì đang thúc đẩy sự phát triển của khối u.

Mô hình chuyển đổi dữ liệu giải trình tự gen thô từ cả mẫu khối u và mẫu bình thường thành hình ảnh đại diện cho các điểm dữ liệu khác nhau, bao gồm dữ liệu giải trình tự và sự sắp xếp của nó dọc theo nhiễm sắc thể. Một mạng thần kinh tích chập phân tích các hình ảnh này để phân biệt giữa bộ gen tham chiếu tiêu chuẩn, các biến thể di truyền bình thường của cá nhân và các biến thể soma gây ung thư, đồng thời lọc bỏ các lỗi giải trình tự. Kết quả đầu ra là danh sách các đột biến liên quan đến ung thư.

DeepSomatic cũng có thể hoạt động ở chế độ ‘chỉ khối u’ khi không có sẵn mẫu tế bào bình thường, điều này thường xảy ra với các bệnh ung thư máu như bệnh bạch cầu. Điều này làm cho công cụ có thể áp dụng trong nhiều tình huống nghiên cứu và lâm sàng.

Huấn luyện một công cụ nghiên cứu ung thư AI chính xác hơn

Việc huấn luyện một mô hình AI chính xác đòi hỏi dữ liệu chất lượng cao. Đối với công cụ AI của mình, Google và các đối tác tại Viện Hệ gen UC Santa Cruz và Viện Ung thư Quốc gia đã tạo ra một bộ dữ liệu chuẩn có tên CASTLE. Họ đã giải trình tự tế bào khối u và tế bào bình thường từ bốn mẫu ung thư vú và hai mẫu ung thư phổi.

Các mẫu này đã được phân tích bằng ba nền tảng giải trình tự hàng đầu để tạo ra một bộ dữ liệu tham chiếu duy nhất, chính xác bằng cách kết hợp các kết quả đầu ra và loại bỏ lỗi đặc trưng của nền tảng. Dữ liệu cho thấy ngay cả cùng một loại ung thư cũng có thể có các dấu hiệu đột biến khác nhau đáng kể, thông tin này có thể giúp dự đoán phản ứng của bệnh nhân với các phương pháp điều trị cụ thể.

Các mô hình DeepSomatic hoạt động tốt hơn các phương pháp đã được thiết lập khác trên cả ba nền tảng giải trình tự chính. Công cụ này vượt trội trong việc xác định các đột biến phức tạp được gọi là chèn và xóa, hay ‘Indels’. Đối với các biến thể này, DeepSomatic đạt điểm F1 là 90% trên dữ liệu giải trình tự Illumina, so với 80% của phương pháp tốt nhất tiếp theo. Sự cải thiện còn ấn tượng hơn trên dữ liệu Pacific Biosciences, nơi DeepSomatic đạt hơn 80% trong khi công cụ tốt nhất tiếp theo đạt dưới 50%.

AI hoạt động tốt khi phân tích các mẫu khó. Thử nghiệm bao gồm một mẫu ung thư vú được bảo quản bằng phương pháp cố định formalin nhúng paraffin (FFPE), một phương pháp phổ biến có thể gây tổn thương DNA và làm phức tạp phân tích. Nó cũng được thử nghiệm trên dữ liệu từ giải trình tự toàn bộ exome (WES), một phương pháp tiết kiệm hơn chỉ giải trình tự 1% bộ gen mã hóa protein. Trong cả hai kịch bản, DeepSomatic đều vượt trội hơn các công cụ khác, cho thấy tính hữu ích của nó trong việc phân tích các mẫu chất lượng thấp hơn hoặc mẫu lịch sử.

Một công cụ AI cho mọi loại ung thư

Công cụ AI này đã chứng minh rằng nó có thể áp dụng kiến thức của mình cho các loại ung thư mới mà nó chưa được huấn luyện. Khi được sử dụng để phân tích một mẫu u nguyên bào thần kinh đệm (glioblastoma), một loại ung thư não ác tính, nó đã xác định thành công một vài biến thể được biết là gây ra bệnh. Trong quan hệ đối tác với Children’s Mercy ở Kansas City, nó đã phân tích tám mẫu bệnh bạch cầu ở trẻ em và tìm thấy các biến thể đã biết trước đây, đồng thời xác định thêm 10 biến thể mới, mặc dù chỉ làm việc với các mẫu chỉ có khối u.

Google hy vọng các phòng thí nghiệm nghiên cứu và bác sĩ lâm sàng sẽ áp dụng công cụ này để hiểu rõ hơn về từng khối u. Bằng cách phát hiện các biến thể ung thư đã biết, nó có thể giúp định hướng lựa chọn các phương pháp điều trị hiện có. Bằng cách xác định các biến thể mới, nó có thể dẫn đến các liệu pháp mới. Mục tiêu là thúc đẩy y học chính xác và mang lại các phương pháp điều trị hiệu quả hơn cho bệnh nhân.

Xem thêm: MHRA đẩy nhanh làn sóng công cụ AI tiếp theo để chăm sóc bệnh nhân

Banner cho Triển lãm AI & Big Data của sự kiện TechEx.

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy xem Triển lãm AI & Big Data diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx và được đồng tổ chức với các sự kiện công nghệ hàng đầu khác bao gồm Triển lãm An ninh mạng, nhấp vào đây để biết thêm thông tin.

AI News được cung cấp bởi TechForge Media. Khám phá các sự kiện và hội thảo trực tuyến về công nghệ doanh nghiệp sắp tới khác tại đây.

Công cụ AI của Google xác định các yếu tố di truyền gây ung thư

Thách thức của các biến thể soma

DeepSomatic hoạt động như thế nào

Huấn luyện một công cụ nghiên cứu ung thư AI chính xác hơn

Một công cụ AI cho mọi loại ung thư

Bài viết liên quan

Vì sao ChatGPT cũng có thể bị 'thối não'? Hiện tượng AI model degradation

Studio game nào đang dùng AI hiệu quả, studio nào đang thất bại? Toàn cảnh 2026

OpenAI vs. Anthropic vs. Google: ai đang giải quyết vấn đề model collapse tốt nhất?