Trellix phát triển AI - Cách mạng hóa quản lý sự cố với tự động hóa & LLM

Trellix phát triển AI – Cách mạng hóa quản lý sự cố với tự động hóa & LLM

Quản lý hạ tầng và ứng dụng trong môi trường CNTT phức tạp ngày nay ngày càng trở nên thách thức. Các doanh nghiệp phải đảm bảo tính sẵn sàng cao và độ tin cậy ổn định trên nhiều môi trường đám mây và kiến trúc ứng dụng khác nhau. Vì lí do đó, Trellix phát triển AI nhằm cải thiện các sản phẩm an ninh mạng bằng LLM và GenAI, đồng thời tối ưu hóa vận hành CNTT nội bộ.

Trellix phát triển AI trong bối cảnh nhiều thách thức

Quản lý hạ tầng và ứng dụng trong môi trường CNTT phức tạp đòi hỏi doanh nghiệp duy trì tính sẵn sàng cao và độ tin cậy ổn định trên nhiều nền tảng khác nhau. Tuy nhiên, điều này kéo theo nhiều thách thức như:

  • Quá tải cảnh báo

Với nhiều công cụ giám sát liên tục gửi cảnh báo, các nhóm CNTT phải xử lý một lượng lớn thông báo, nhiều trong số đó có thể bị trùng lặp hoặc không quan trọng, dẫn đến tình trạng quá tải và bỏ lỡ các sự cố quan trọng.

  • Quản lý sự cố phân tán

Các hệ thống và công cụ khác nhau dẫn đến quy trình quản lý sự cố bị phân tán, gây khó khăn trong việc liên kết cảnh báo và theo dõi sự cố trên nhiều nền tảng.

  • Xử lý thủ công tốn kém

Một lượng lớn thời gian và nguồn lực bị tiêu tốn để điều tra và giải quyết sự cố theo cách thủ công, đặc biệt đối với hỗ trợ cấp 1 và cấp 2, làm tăng chi phí vận hành và kéo dài thời gian phản hồi.

  • Thiếu thông tin ngữ cảnh

Cảnh báo thường không đi kèm với thông tin chi tiết để nhanh chóng xác định nguyên nhân gốc rễ và các dịch vụ bị ảnh hưởng.

  • Vấn đề mở rộng quy mô

Khi hạ tầng và ứng dụng mở rộng, các phương pháp quản lý sự cố truyền thống trở nên khó duy trì, đòi hỏi các giải pháp tự động và thông minh hơn.

Đây chính là lúc AIOps phát huy vai trò quan trọng, sử dụng AI/ML để tự động hóa các hoạt động CNTT và đảm bảo quản lý sự cố một cách liền mạch. Trellix phát triển AI nhằm cải thiện các sản phẩm an ninh mạng bằng LLM và GenAI, đồng thời xây dựng một nền tảng AIOps để tối ưu hóa vận hành CNTT nội bộ. Bằng cách tự động hóa hỗ trợ cấp 1 và cấp 2 cho các ứng dụng, công cụ này giúp giảm chi phí vận hành (COGS), nâng cao hiệu suất và cải thiện hiệu quả tổng thể.

Trellix phát triển AI – Hợp nhất cảnh báo từ nhiều nguồn

Nền tảng AIOps của Trellix tích hợp cảnh báo từ nhiều công cụ giám sát hàng đầu trong ngành như:

  • PagerDuty: Nền tảng phản hồi sự cố theo thời gian thực.
  • Grafana: Công cụ giám sát và trực quan hóa dữ liệu.
  • AWS CloudWatch: Dịch vụ giám sát và quản lý tài nguyên đám mây AWS.
  • GCP Cloud Monitoring: Công cụ giám sát hiệu suất trên nền tảng Google Cloud.
  • Wiz: Nền tảng bảo mật đám mây với khả năng giám sát sâu và cung cấp ngữ cảnh bảo mật.

Các công cụ này tạo cảnh báo dựa trên nhiều chỉ số, ngưỡng và sự kiện bảo mật. Tuy nhiên, nếu không được xử lý đúng cách, việc quản lý các cảnh báo riêng lẻ có thể dẫn đến tình trạng quá tải và giảm hiệu suất xử lý sự cố. AIOps của Trellix phát triển AI quản lý hoạt động ATTT bằng cách sử dụng AI/ML để liên kết và phân tích các cảnh báo một cách thông minh.

 Trang sự cố (Incident page) - Liên kết cảnh báo & Tạo sự cốTrang sự cố (Incident page) – Liên kết cảnh báo & Tạo sự cố

Đọc thêm: Bứt phá bảo mật: Chống tấn công mạng nhờ trí tuệ nhân tạo AI 

Liên kết cảnh báo với LLM/GenAI và tương quan hệ thống

Mô hình AIOps của Trellix không chỉ ghép nối các cảnh báo theo từ khóa mà còn sử dụng AI/ML để phân tích ngữ cảnh và nhận diện các mẫu liên quan. Ngoài ra, hệ thống còn áp dụng phương pháp tương quan theo cấu trúc phân cấp dựa trên kiến trúc ứng dụng lưu trữ trong cơ sở dữ liệu đồ thị, giúp liên kết các cảnh báo theo quan hệ tầng lớp giữa các thành phần hệ thống.

Bổ sung dữ liệu và phân tích sự cố

Sau khi tạo sự cố, AIOps sẽ bổ sung dữ liệu cần thiết để hỗ trợ giải quyết nhanh chóng, bao gồm:

  • Xác định các node và dịch vụ bị ảnh hưởng
  • Xác định mức độ nghiêm trọng và ưu tiên sự cố
  • Cung cấp ngữ cảnh liên quan và hướng dẫn xử lý
  • Tự động gán sự cố đến nhóm phù hợp thông qua tích hợp với Confluence
  • Phân tích nguyên nhân gốc rễ và đề xuất giải pháp khắc phục

Trellix phát triển AI quản lý hoạt động ATTT – Tích hợp với công cụ ITSM để quản lý sự cố hiệu quả

Hệ thống AIOps của Trellix hỗ trợ tích hợp với JIRA để quản lý sự cố thông qua hai kịch bản chính:

  1. Tự động giải quyết sự cố: Khi ticket được tạo trong JIRA, hệ thống sẽ kích hoạt quy trình tự động phù hợp để xử lý và đóng ticket mà không cần can thiệp thủ công.
  2. Hỗ trợ xử lý thủ công: Nếu không có quy trình tự động, AIOps sẽ chỉ định ticket đến nhóm phù hợp và cung cấp hướng dẫn chi tiết để đảm bảo xử lý sự cố hiệu quả.

Trực quan hóa các Node bị ảnh hưởng

AIOps cung cấp công cụ trực quan hóa kiến trúc hệ thống bị ảnh hưởng, giúp các nhóm vận hành nhanh chóng xác định khu vực có vấn đề và đánh giá phạm vi tác động.

Bản đồ cấu trúc mạngBản đồ cấu trúc mạng

Tự động hóa quy trình xử lý sự cố với Workflow Engine

Nền tảng AIOps của Trellix tích hợp với Workflow automation engine, hỗ trợ tự động hóa nhiều tác vụ như:

  • Tự động hóa hạ tầng: Mở rộng, cấu hình, và quản lý tài nguyên.
  • Tự động hóa cấu hình: Đảm bảo tính nhất quán trong thiết lập hệ thống.
  • Cung cấp dịch vụ tự động: Quản lý triển khai dịch vụ trên môi trường đám mây và on-premises.
  • Tự động hóa DevOps: Hỗ trợ CI/CD và xử lý nhanh các sự cố trong phát triển phần mềm.
  • Quản lý sự cố tự động: Phát hiện, chẩn đoán và xử lý sự cố mà không cần can thiệp thủ công.

Workflow engine có thể chạy các script bằng nhiều ngôn ngữ như Bash, Shell, Python và PowerShell, mang đến khả năng tùy chỉnh cao và tự động hóa linh hoạt.

Quy trình tự động xử lý sự cố - Workflow EngineQuy trình tự động xử lý sự cố – Workflow Engine

Quy trình tự động quản lý sự cố trong AIOps

Hệ thống AIOps của Trellix hoạt động theo quy trình:

  1. Thu thập cảnh báo từ các nguồn giám sát.
  2. Làm giàu dữ liệu bằng cách truy vấn cơ sở dữ liệu đồ thị.
  3. Tương quan cảnh báo để phát hiện mẫu và nhóm chúng thành sự cố.
  4. Tạo sự cố và làm giàu thông tin để xác định mức độ ưu tiên và tác động.
  5. Quản lý sự cố trên JIRA và thực hiện quy trình tự động hoặc hỗ trợ xử lý thủ công.
  6. Tự động xử lý sự cố bằng Workflow engine và đóng ticket trên JIRA.

Kiến trúc luồng AIOpsKiến trúc luồng AIOps

Kết luận

Bằng cách kết hợp LLM/GenAI, tương quan phân cấp, cơ sở dữ liệu đồ thị, tích hợp ITSM và tự động hóa quy trình, việc Trellix phát triển AI đang đưa AIOps lên một tầm cao mới. Công cụ này giúp giảm MTTR, nâng cao hiệu suất vận hành, và đảm bảo hạ tầng CNTT luôn ổn định và an toàn.

Bạn đã sẵn sàng nâng cấp hệ thống bảo mật và chuyển đổi vận hành IT một cách thông minh?

Liên hệ Mi2 ngay hôm nay để khám phá giải pháp AIOps từ Trellix – chìa khóa giúp doanh nghiệp chủ động phát hiện, xử lý sự cố nhanh chóng và nâng cao hiệu suất vận hành trong kỷ nguyên số!

Liên hệ chúng tôi

Để biết thêm chi tiết về sản phẩm, dịch vụ trong bài viết, vui lòng liên hệ chúng tôi hoặc để lại thông tin, chúng tôi sẽ liên hệ lại trong thời gian sớm nhất:

Mục lục bài viết

Đặt lịch tư vấn

Đăng ký nhận bản tin từ chúng tôi