Dùng Xử lý ngôn ngữ tự nhiên (NLP) để phát hiện bệnh tâm thần, case study tại Mỹ

Nhu cầu về sức khỏe tâm thần đang gia tăng. Ngày nay, cứ năm người Mỹ thì có một người mắc bệnh tâm thần và tỷ lệ tự tử trong hai thập kỷ qua đã tăng hơn 30%. Các tổ chức như Liên minh Quốc gia về Bệnh Tâm thần (National Alliance on Mental Illness, NAMI), nơi cung cấp hỗ trợ miễn phí cho những người gặp khủng hoảng, đã chứng kiến ​​​​số người tìm kiếm trợ giúp tăng 60% trong khoảng thời gian từ năm 2019 đến năm 2021.

Để giải quyết sự gia tăng này, các tổ chức và nhà cung cấp dịch vụ chăm sóc sức khỏe đang chuyển sang sử dụng các công cụ kỹ thuật số. Các nền tảng công nghệ như đường dây nóng xử lý khủng hoảng, đường dây nhắn tin và đường dây trò chuyện trực tuyến đã đào tạo và bổ sung nhân viên để hỗ trợ bệnh nhân đang gặp khủng hoảng. Mặc dù vậy, tỷ lệ cuộc gọi bị rớt đối với các tổ chức như vậy vẫn ở mức cao tới 25%. Hơn nữa, phần lớn các dịch vụ này đều do bác sĩ lâm sàng của người gọi thực hiện.

Một trong những yếu tố chính gây ra tỷ lệ cao này là do nhu cầu của bệnh nhân vượt xa đáng kể số lượng người đáp ứng sẵn có. Vào năm 2020, Đường dây nóng ngăn chặn tự tử quốc gia báo cáo tỷ lệ phản hồi chỉ là 30% đối với trò chuyện và 56% đối với tin nhắn văn bản, khiến nhiều bệnh nhân gặp khủng hoảng mà không được hỗ trợ. Hơn nữa, các hệ thống này sử dụng phương pháp xếp hàng tiêu chuẩn cho các tin nhắn đến, trong đó bệnh nhân được phục vụ trên cơ sở ai đến trước được phục vụ trước, trái ngược với mức độ khẩn cấp của họ.

Điều gì sẽ xảy ra nếu những nền tảng này có thể phân biệt giữa các tin nhắn khẩn cấp và không khẩn cấp, từ đó nâng cao hiệu quả trong việc xử lý các trường hợp khủng hoảng?

Đây chính xác là những gì Akshay Swaminathan và Ivan Lopez — sinh viên y khoa Stanford — bắt đầu thực hiện với nhóm cộng tác viên liên ngành của họ, bao gồm các bác sĩ lâm sàng và lãnh đạo hoạt động tại Cerebral, một công ty sức khỏe tâm thần trực tuyến quốc gia, nơi Swaminathan dẫn đầu về khoa học dữ liệu.

Nhóm nghiên cứu bao gồm Jonathan Chen, chi nhánh Stanford HAI và trợ lý giáo sư y khoa tại Trung tâm nghiên cứu tin học y sinh Stanford, và Olivier Gevaert, phó giáo sư y khoa và khoa học dữ liệu y sinh của Stanford. Các tác giả đã xuất bản công trình của họ trên npj Digital Medicine .

Bằng cách sử dụng xử lý ngôn ngữ tự nhiên (NLP), nhóm đã phát triển một hệ thống máy học (Machine Learning, ML) có tên là Trình phát hiện thông báo khủng hoảng 1 (Crisis Message Detector 1, viết tắt CMD-1) có thể xác định và tự động phân loại các thông báo liên quan, giảm thời gian chờ đợi của bệnh nhân từ 10 giờ xuống dưới 10 phút.

“Đối với những khách hàng có ý định tự tử, thời gian chờ đợi đơn giản là quá dài. Ý nghĩa của nghiên cứu của chúng tôi là khoa học dữ liệu và ML có thể được tích hợp thành công vào quy trình làm việc của bác sĩ lâm sàng, dẫn đến những cải tiến đáng kể khi xác định bệnh nhân có nguy cơ và tự động hóa loại bỏ những công việc thực sự thủ công này,” Swaminathan nói.

Kết quả của họ nhấn mạnh tầm quan trọng của ứng dụng CMD-1 đối với các tình huống trong đó tốc độ là rất quan trọng. Lopez cho biết, “CMD-1 nâng cao hiệu quả của các nhóm ứng phó khủng hoảng, cho phép họ giải quyết số lượng lớn các trường hợp một cách hiệu quả hơn. Với khả năng phân loại nhanh hơn, các nguồn lực có thể được phân bổ hiệu quả hơn, ưu tiên các trường hợp khẩn cấp.”

Trao quyền cho các chuyên gia xử lý khủng hoảng

Dữ liệu mà nhóm sử dụng làm nền tảng cho CMD-1 đến từ Cerebral, nơi nhận hàng nghìn tin nhắn của bệnh nhân mỗi ngày trong hệ thống trò chuyện của mình. Tin nhắn có thể bao gồm các chủ đề khác nhau như lên lịch hẹn và nạp thuốc, cùng với tin nhắn từ bệnh nhân đang trong tình trạng khẩn cấp.

Bắt đầu với mẫu ngẫu nhiên gồm 200.000 tin nhắn, họ gắn nhãn tin nhắn của bệnh nhân là “khủng hoảng” hoặc “không khủng hoảng” bằng cách sử dụng bộ lọc bao gồm các yếu tố như từ chính về khủng hoảng và ID bệnh nhân trước đó đã báo cáo về một cơn khủng hoảng trong tuần trước. Các thông điệp khủng hoảng cần được chú ý hơn nữa, lưu ý đến các biểu hiện của ý tưởng tự sát hoặc giết người, bạo lực gia đình hoặc tự gây thương tích (tự làm hại bản thân).

“Đối với những tin nhắn không rõ ràng, chẳng hạn như ‘Tôi cần giúp đỡ’, chúng tôi đã sai lầm khi gọi đó là một cuộc khủng hoảng. Chỉ từ cụm từ đó, bạn không biết liệu bệnh nhân có cần trợ giúp trong việc đặt lịch hẹn hay ra khỏi giường hay không.”, Swaminathan nói.

Nhóm cũng kiên định trong việc đảm bảo rằng cách tiếp cận của họ sẽ bổ sung nhưng không thay thế được sự đánh giá của con người. CMD-1 hiển thị các thông báo khủng hoảng và gửi chúng cho con người để xem xét như một phần của quy trình ứng phó khủng hoảng điển hình của họ trong giao diện Slack. Bất kỳ thông báo khủng hoảng thực sự nào mà mô hình không hiển thị được (âm tính giả) đều được con người xem xét như một phần của quy trình hỗ trợ trò chuyện thông thường.

Như Lopez nói: “Cách tiếp cận này rất quan trọng trong việc đảm bảo chúng tôi giảm nguy cơ âm tính giả nhiều nhất có thể. Cuối cùng, yếu tố con người trong việc xem xét và giải thích các thông điệp đảm bảo sự cân bằng giữa hiệu quả công nghệ và sự chăm sóc nhân ái, điều này rất cần thiết trong bối cảnh trường hợp khẩn cấp về sức khỏe tâm thần.”

Do tính nhạy cảm của lĩnh vực chủ đề nên nhóm cực kỳ thận trọng trong cách phân loại thông điệp. Họ đã xem xét Tiêu cực sai (thiếu một thông báo khủng hoảng thực sự) và Tích cực sai (hiển thị không chính xác một thông báo không khủng hoảng), đồng thời làm việc với các bên liên quan về lâm sàng, xác định rằng cái giá phải trả của việc thiếu một Tiêu cực sai cao hơn 20 lần so với việc giải quyết một Sai. Tích cực.

“Đây thực sự là điểm quan trọng khi triển khai các mô hình ML. Bất kỳ mô hình ML nào đang thực hiện phân loại—gọi là ‘khủng hoảng’ hoặc ‘không phải khủng hoảng’—trước tiên phải đưa ra xác suất từ ​​0 đến 1. Nó đưa ra xác suất là thông điệp là một cuộc khủng hoảng, nhưng chúng ta phải chọn ngưỡng đó, trên ngưỡng đó mô hình gọi đó là khủng hoảng và dưới ngưỡng đó mô hình cho biết đó không phải là khủng hoảng. Việc lựa chọn ngưỡng đó là một quyết định quan trọng và quyết định đó không nên được đưa ra bởi những người xây dựng mô hình, nó phải được thực hiện bởi những người dùng cuối của mô hình. Đối với chúng tôi, đó là các nhóm lâm sàng”, Swaminathan nói.

Đáng chú ý, CMD-1 có thể phát hiện các tin nhắn có nguy cơ cao với độ chính xác ấn tượng (độ nhạy 97% và độ đặc hiệu 97%), đồng thời nhóm đã giảm thời gian phản hồi cho người tìm kiếm trợ giúp từ hơn 10 giờ xuống chỉ còn 10 phút. Tốc độ này rất quan trọng vì sự can thiệp nhanh chóng có khả năng chuyển hướng những bệnh nhân có nguy cơ cao khỏi ý định tự sát.

Tiềm năng của ML trong chăm sóc sức khỏe

Với những kết quả đáng chú ý của họ, nhóm nghiên cứu hy vọng rằng sẽ có nhiều mô hình học máy hơn được triển khai trong các cơ sở chăm sóc sức khỏe, điều này hiện hiếm khi xảy ra, vì việc triển khai mô hình đòi hỏi phải chuyển đổi cẩn thận sang bối cảnh lâm sàng và chú ý kỹ đến các cân nhắc về kỹ thuật và vận hành, cũng như cơ sở hạ tầng công nghệ.

“Thông thường, các nhà khoa học dữ liệu tạo ra các mô hình ML có độ chính xác cao mà không giải quyết đầy đủ các điểm yếu của các bên liên quan. Do đó, các mô hình này, mặc dù thành thạo về mặt kỹ thuật, nhưng có thể tạo ra công việc bổ sung hoặc không thể tích hợp liền mạch vào quy trình làm việc lâm sàng hiện có. Để áp dụng rộng rãi hơn, dữ liệu Các nhà khoa học phải thu hút sự tham gia của các chuyên gia chăm sóc sức khỏe ngay từ đầu, đảm bảo rằng các mô hình giải quyết được những thách thức mà chúng được thiết kế để giải quyết, hợp lý hóa thay vì làm phức tạp các nhiệm vụ và phù hợp một cách hữu cơ với cơ sở hạ tầng lâm sàng hiện có”, Lopez nói.

Nhóm phát triển CMD-1 đã áp dụng một cách tiếp cận độc đáo là tập hợp một nhóm bác sĩ lâm sàng và nhà khoa học dữ liệu đa chức năng để đảm bảo mô hình đáp ứng các ngưỡng lâm sàng quan trọng và có thể mang lại kết quả có ý nghĩa trong môi trường hoạt động lâm sàng thực tế. Chen cho biết: “Hệ thống hấp dẫn được phát triển ở đây không chỉ thể hiện kết quả phân tích mà còn thể hiện công việc khó khăn hơn nhiều trong việc tích hợp kết quả đó vào quy trình làm việc thực sự, cho phép bệnh nhân và bác sĩ lâm sàng tiếp cận nhau vào thời điểm quan trọng”.

Cách tiếp cận đa chức năng này, kết hợp với các kết quả đáng chú ý của CMD-1, đã cho Swaminathan và Lopez thấy công nghệ có thể được sử dụng như thế nào để tăng cường tác động của các bác sĩ lâm sàng. Swaminathan cho biết: “Đây là hướng mà AI trong y học đang hướng tới, nơi chúng tôi đang sử dụng dữ liệu để giúp việc cung cấp dịch vụ chăm sóc sức khỏe trở nên nhân văn hơn, giúp cuộc sống của các bác sĩ lâm sàng dễ dàng hơn và trao quyền cho họ cung cấp dịch vụ chăm sóc chất lượng cao hơn”.

Rate this post

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *