Hiện nay, những kẻ đe dọa có thể tận dụng các công cụ AI như ChatGPT, PaLM 2 của Google, AI TensorFlow,… để hỗ trợ cho các cuộc tấn công mạng nhắm mục tiêu vào công nghệ vận hành (Operational Technology – OT) và các thiết bị không được quản lý. Trong bài viết hôm nay, Mi2 và Forescout sẽ nhấn mạnh lý do tại sao các tổ chức y tế & chăm sóc sức khỏe nên đặc biệt lo lắng về vấn đề này.
Tình hình vi phạm dữ liệu trong lĩnh vực y tế & chăm sóc sức khỏe
Ngày nay, khi các tổ chức y tế và chăm sóc sức khỏe ngày càng phát triển và dần phụ thuộc vào công nghệ thông tin y tế, họ cũng tăng khả năng tiếp xúc với các rủi ro an ninh mạng mới, chẳng hạn như các cuộc tấn công ransomware, phishing, SQL Injection,…
Theo Verizon – một tập đoàn đa quốc gia của Mỹ về lĩnh vực truyền thông và mạng cho biết: Vi phạm dữ liệu trong lĩnh vực chăm sóc sức khỏe đang đạt mức cao nhất mọi thời đại. Cụ thể vào năm 2023, với 67% sự cố ảnh hưởng đến dữ liệu y tế cá nhân và 54% ảnh hưởng đến dữ liệu y tế chung. Theo một nghiên cứu khác, một cuộc tấn công ransomware trung bình vào năm 2021 đã làm lộ thông tin sức khoẻ cá nhân của 229.000 bệnh nhân, nhiều hơn gấp 06 lần so với lượng trung bình bị xâm phạm trong năm 2016.
Thông thường, kẻ tấn công sẽ lấy dữ liệu này từ cơ sở dữ liệu CNTT, nhưng có một nguồn dữ liệu khác nguy hiểm không kém nhưng lại ít bị khám phá hơn: các thiết bị y tế. Vào năm 2020, Forescout đã chỉ ra phương cách các giao thức không an toàn được sử dụng để truyền dữ liệu giữa các thiết bị y tế cho phép kẻ tấn công thu thập thông tin sức khỏe cá nhân trực tiếp từ dữ liệu mạng bị đánh cắp.
Dưới đây, Mi2 – Forescout sẽ trình bày kiểu tấn công tương tự được hacker thực hiện như thế nào thông qua sự hỗ trợ của Trí tuệ nhân tạo (AI). Điểm mạnh của AI trong trường hợp này là kẻ tấn công không cần hiểu các giao thức đang được sử dụng (thường là các giao thức độc quyền hoặc khác biệt rất lớn so với các giao thức Công nghệ thông tin thông thường) và tốc độ phát triển ngày càng lớn của AI để thu thập dữ liệu mục tiêu.
Ví dụ về hình thức tấn công mạng được hỗ trợ bởi AI
Hình ảnh dưới đây cho thấy dữ liệu nhạy cảm được truyền đi dưới dạng văn bản rõ ràng trên một số mạng chăm sóc sức khỏe thông qua ba giao thức cụ thể: POCT01 , LIS02 – cả hai đều được sử dụng bởi các thiết bị xét nghiệm tại chỗ và thiết bị phòng thí nghiệm – và một giao thức độc quyền được sử dụng bởi hệ thống cấp phát thuốc BD Pyxis MedStation.
Dữ liệu được quan sát bao gồm tên bệnh nhân, ngày sinh, kết quả xét nghiệm và thuốc được kê đơn. Luồng dữ liệu này được thu thập từ các mạng chăm sóc sức khỏe thực tế. (Vì tính chất nhạy cảm, thông tin cá nhân đã được che lại một phần).
Khi quan sát luồng dữ liệu, việc nhận biết dữ liệu nhạy cảm là dễ dàng đối với con người. Tuy nhiên, để trích xuất dữ liệu này với số lượng lớn để có thể bán trên thị trường chợ đen, kẻ tấn công cần phải viết trình phân tích cú pháp cho các giao thức này. Việc đó giúp chúng chỉ trích xuất dữ liệu quan trọng ở định dạng phù hợp. Các giao thức này về bản chất không phức tạp, nhưng chúng không phổ biến, vì vậy không có trình phân tích cú pháp nào được tích hợp trong Wireshark.
Để đạt được mục tiêu trích xuất dữ liệu nhạy cảm, Forescout đã hướng dẫn ChatGPT tạo 03 trình phân tích cú pháp riêng biệt, một trình phân tích cú pháp cho mỗi giao thức.
Lưu ý: Trong tất cả các ví dụ bên dưới, các thông tin như tên bệnh nhân, ngày sinh và chỉ định xét nghiệm đã được thay đổi so với các số liệu thực nên Forescout không che tất cả các hình ảnh. Cấu trúc của các tin nhắn vẫn không thay đổi.
Đầu tiên, Forescout tận dụng ChatGPT để trích xuất ID, tên và ngày sinh của bệnh nhân từ tin nhắn POCT01, như minh họa bên dưới:
Đây là một nhiệm vụ dễ dàng vì giao thức tuân theo định dạng XML tiêu chuẩn, do đó, kịch bản được tạo sẽ sử dụng các thư viện hiện có để thực hiện lệnh. Kịch bản kết quả được hiển thị bên dưới. Chúng ta có thể sử dụng kịch bản này mà không cần bất kỳ sửa đổi nào, mặc dù nó có thể trả về một ngoại lệ khi có bệnh nhân không có tên hoặc thông tin ngày sinh.
Đọc thêm: Chat GPT – Siêu AI thay đổi cuộc chơi hay nhân tố báo động nền an ninh mạng?
Thứ hai, Forescout đã yêu cầu ChatGPT trích xuất thông tin tương tự từ các tin nhắn LIS02:
Mặc dù điều đó cũng dễ dàng đối với ChatGPT, nhưng LIS02 không được biết đến nhiều như XML. Do đó, công cụ đã tạo mã sử dụng các biểu thức thông thường để thu thập dữ liệu mong muốn. Cũng có một lỗi nhỏ trong biểu thức chính được tạo và Forescout phải thay đổi nó theo cách thủ công. (Regex ban đầu được hiển thị nhận xét ở dòng 18 bên dưới, trong khi phiên bản đã thay đổi của nó được hiển thị ở dòng 19).
Cuối cùng, Forescout đã sử dụng ChatGPT để trích xuất tên bệnh nhân và đơn thuốc từ giao thức BD độc quyền (theo định dạng hơi giống với LIS02, với các ký tự “|” theo hàng dọc đóng vai trò là dấu phân cách). Một lần nữa, Forescout phải thực hiện một sửa đổi nhỏ đối với tập lệnh kết quả: tên bệnh nhân thực sự nằm trong chỉ mục trường 21, không phải 28 như được công cụ tự động xác định.
Bằng cách sử dụng tất cả các trình phân tích cú pháp được tạo này, Forescout có thể tự động lấy dữ liệu bệnh nhân sau từ luồng dữ liệu:
Cuối cùng, Forescout đã yêu cầu ChatGPT giúp lọc dữ liệu này qua một kênh bí mật chung – hầm DNS – để giúp tránh bị phát hiện. Đây là những gì ChatGPT phản hồi:
Tin tốt! – Ảo giác của ChatGPT có thể khiến kẻ tấn công lạc đường
Mặc dù kết quả ở trên là thành công cho kẻ tấn công mạng, nhưng ChatGPT cũng có thể đưa ra câu trả lời sai nghe có vẻ rất thuyết phục và khiến những kẻ đe dọa lạc hướng. Loại câu trả lời này thường được gọi là “ảo giác”.
Forescout đã cố gắng sao chép một cuộc tấn công mạng khác: ngắt kết nối máy theo dõi bệnh nhân khỏi hệ thống giám sát trung tâm (CMS), do đó ngăn việc hiển thị dữ liệu trực tiếp. Mục tiêu của Forescout là tái tạo cuộc tấn công giả rằng Forescout không biết gì về thiết bị hoặc các giao thức mà nó sử dụng, để kiểm tra xem ChatGPT có thể giúp như thế nào. Ban đầu, Forescout cố gắng tìm hiểu xem ChatGPT có thể xác định giao thức được thiết bị sử dụng hay không:
Câu trả lời trên là sai, thiết bị này sử dụng một giao thức độc quyền có tên là “Xuất dữ liệu” trên cổng 24105. Forescout đã tìm kiếm “PMnet” trực tuyến nhưng không thể tìm thấy bất kỳ tài liệu tham khảo có ý nghĩa nào về nó, điều này khiến Forescout tin rằng giao thức này không tồn tại. Forescout đã nói với ChatGPT rằng thiết bị sử dụng một giao thức khác, và đã khiến ChatGPT thay đổi câu trả lời:
Sau đó, Forescout đã yêu cầu AI giúp tạo thông báo Hiệp hội hủy bỏ xuất dữ liệu để ngắt kết nối thiết bị, như Forescout đã thực hiện theo cách thủ công trong nghiên cứu ban đầu. Forescout đã xác định chính xác loại thông báo do ChatGPT ban đầu không nhận dạng được giao thức. Một lần nữa, công cụ này đã tạo ra một câu trả lời vô nghĩa, tuy nhiên nghe có vẻ rất thuyết phục:
Có AI hỗ trợ hay không, hãy tập trung vào các TTPs phổ biến nhất của đối thủ
Trí tuệ nhân tạo AI được tạo ra để thay đổi cách thức hoạt động của các tổ chức y tế & chăm sóc sức khỏe. Giống như hầu hết mọi ngành khác, bằng cách tăng năng suất và tự động hóa các nhiệm vụ của con người. Thật không may, các công cụ như ChatGPT cũng có thể giúp những kẻ tấn công tạo ra các lỗ hổng và lấy cắp dữ liệu nhạy cảm từ các tổ chức chăm sóc sức khỏe, giống như cách mà Forescout đã chứng minh nó có thể tạo điều kiện cho khai thác OT.
Bất chấp những tiến bộ này, các chiến thuật, kỹ thuật và thủ tục (tactics, techniques and procedures – TTPs) được các tác nhân đe dọa áp dụng vẫn không thay đổi. Do đó, hãy tập trung phòng thủ của bạn vào những kẻ thù được biết là nhắm mục tiêu vào lĩnh vực chăm sóc sức khỏe và các TTPs phổ biến nhất của chúng. Việc quy trình đang được sử dụng có phải do AI tạo ra hay không không quan trọng bằng việc liệu tổ chức của bạn có thể phát hiện và phản hồi quy trình đó hay không, bất kể thiết bị hoặc giao thức nào đang được nhắm mục tiêu.
Các tác nhân đe dọa thường có thói quen sử dụng các chiến thuật, kỹ thuật và thủ tục (TPPs) cùng một cách tiếp cận, được tài liệu hoá rõ ràng và đầy đủ để giành quyền truy cập ban đầu, xác minh thông tin đăng nhập và thực hiện một cuộc tấn công mà chúng đã thành công cho đến khi bị ngăn chặn. Khi bạn đã nắm rõ các TTPs đó, hãy đảm bảo rằng tổ chức bạn có các công cụ bảo mật và nguồn dữ liệu phù hợp để phát hiện chúng. Một giải pháp phát hiện và phản hồi mở rộng là điều cần thiết và cấp bách!
Forescout® XDR đi kèm với một ma trận MITRE ATT&CK trực quan hiển thị những nguồn dữ liệu nào cần tiếp nhận vào để bao phủ các TTPs cụ thể, xác định các điểm mù tiềm năng mà kẻ tấn công có thể khai thác và xác định nguồn dữ liệu bổ sung nào sẽ nâng cao hơn phạm vi bảo vệ của tổ chức/doanh nghiệp bạn.
Đọc thêm: Các trường hợp quan trọng cần ứng dụng mô hình MITRE ATT&CK
Hãy chuẩn bị cho các cuộc tấn công mạng do AI hỗ trợ!
Các cuộc tấn công do AI hỗ trợ ngày càng trở nên phổ biến, ảnh hưởng đến thiết bị, dữ liệu và con người theo những cách không mong muốn. Mọi doanh nghiệp đặc biệt là các tổ chức y tế và chăm sóc sức khoẻ phải tập trung vào việc đảm bảo rằng họ có sẵn hệ thống an ninh mạng cơ bản để chống lại các cuộc tấn công trong tương lai này.
Tin tốt là các phương pháp bảo mật hay nhất vẫn không thay đổi. Các nguyên tắc bảo mật như vệ sinh mạng, phòng thủ chuyên sâu, truy cập đặc quyền, phân đoạn mạng và Zero-Trust đều còn hiệu lực. Các cuộc tấn công có thể trở nên thường xuyên vì những kẻ xấu sẽ dễ dàng tạo ra phần mềm độc hại hơn nhưng khả năng phòng thủ không thay đổi. Điều cấp bách hơn bao giờ hết là thực thi chúng một cách chủ động và hiệu quả.
Khi ransomware và các mối đe dọa khác tiếp tục phát triển, các vấn đề cơ bản về an ninh mạng vẫn giữ nguyên:
- Duy trì kiểm kê đầy đủ mọi tài sản số, bao gồm cả thiết bị OT và thiết bị không được quản lý.
- Hiểu rủi ro và trạng thái tuân thủ.
- Có thể tự động phát hiện và ứng phó với các mối đe dọa nâng cao nhắm vào các tài sản số của tổ chức.
Ba trụ cột này đi một chặng đường dài hướng tới việc chuẩn bị tổ chức của bạn cho hệ thống bảo mật an toàn trong tương lai!