Узнайте больше о технологиях, которые мы используем для выявления злоумышленников — откуда они берутся, как работают и почему мы их используем.
Искусственный интеллект сейчас на пике популярности, и это неспроста. Недавние достижения в этой области приводят к впечатляющим результатам в самых разных сферах — от беспилотных автомобилей и роботов-пылесосов до распознавания изображений и языка. Безопасность в интернете — это точно та область, где использование ИИ помогает оставаться на шаг впереди. Но как мы до этого дошли, как работает ИИ и почему он полезен для этого?
О чём мы говорим, когда говорим об ИИ
Начнем с самого начала. ИИ часто используется как общее название для нескольких различных дисциплин, включая робототехнику, машинное обучение и его подразделы, такие как искусственные нейронные сети и обработка естественного языка.Хотя это не обязательно неверно, важно понять, что на самом деле означает ИИ. На базовом уровне искусственный интеллект просто означает симуляцию человеческого мышления компьютером.Это что-то, что впервые было предложено в 1939 году как тезис Чёрча-Тьюринга. Простая версия этого тезиса заключается в том, что если мы можем дать компьютеру пошаговое объяснение того, как мы думаем о чем-то, компьютер сможет воспроизводить этот процесс бесконечно.Еще важнее для нас то, что по мере выполнения этого процесса компьютером снова и снова, мы можем обучать его делать небольшие улучшения и 'учиться' по пути. Это позволяет компьютеру становиться очень хорошим — и даже лучше нас — в имитации вещей, которые мы делаем естественно, таких как распознавание образов.
Чтобы повторить предыдущий пример:
Мы могли бы создать ИИ, который предназначен для распознавания видов фруктов. Компьютеру нужно было бы обучиться на наборе данных с изображениями фруктов и их соответствующими метками (например, яблоко, банан, апельсин).Его задача — самостоятельно сопоставлять узоры, которые он видит на каждом изображении, с их соответствующими метками. После множества попыток, в ходе которых мы оцениваем результаты и даем обратную связь, компьютер начинает распознавать визуальные характеристики каждого вида фруктов.Затем его можно использовать для классификации новых, невиданных ранее изображений фруктов как одного из известных видов. Например, при представлении нового изображения клубники он сможет правильно определить его как клубнику, даже если это изображение не входило в набор данных, на котором он обучался.Это и есть машинное обучение. Похожая версия этого процесса используется в таких популярных приложениях, как ChatGPT, для понимания и генерации текста.
Различные типы машинного обучения
Конечно, существует множество способов 'обучить' машину выполнять эти задачи. Для интереса давайте попросим ChatGPT объяснить различные типы методов обучения, с помощью которых обучаются алгоритмы, подобные ему самому (я добавлю заголовки для лучшей читаемости):Когда речь идет о машинном обучении, существует четыре различных типа алгоритмов: с учителем, полуобучаемые, без учителя и с подкреплением. Давайте рассмотрим каждый из них более подробно.
Контрольное обучение
Обучение с контролем предполагает использование размеченных наборов данных для обучения системы путем распознавания паттернов или корреляций между различными переменными. Этот тип алгоритма требует множества примеров пар 'вход-выход', чтобы при встрече с неизвестным входом можно было предсказать правильный выход.Некоторые распространенные применения обучения с учителем включают системы распознавания лиц, программное обеспечение для распознавания речи, системы обнаружения мошенничества с кредитными картами и программы обработки естественного языка (NLP).
Бесконтрольное обучение
Алгоритмы неконтролируемого обучения используются в тех случаях, когда нет доступных обучающих данных с метками. В этом случае алгоритм должен обучаться с помощью кластерного анализа или других методов, чтобы выявить закономерности во входных данных без какой-либо помощи меток. К числу распространенных приложений относятся сегментация потребителей и системы обнаружения аномалий.
Полуконтрольное обучение
Полуконтрольное обучение сочетает в себе элементы как обучения с учителем, так и обучения без учителя. Оно использует размеченные данные для первоначального понимания системы, но затем полагается на неразмеченные данные для уточнения своих знаний.Этот тип алгоритма часто используется, когда имеется большое количество неразмеченных данных и недостаток размеченных данных. Примеры включают распознавание объектов на изображениях и классификацию текста.
Обучение с подкреплением
Обучение с подкреплением Обучение с подкреплением, также известное как RL, отличается от всех других алгоритмов машинного обучения тем, что позволяет системе учиться методом проб и ошибок. Система получает вознаграждение за правильные решения и наказание за ошибки, целью является найти оптимальное решение. Применения RL включают робототехнику, игры и автономные транспортные средства.Независимо от того, какой тип алгоритма машинного обучения вы выберете, помните, что важно понимать, как работает каждый из них, чтобы убедиться, что он используется правильно и эффективно.
Удачи!…Да, вся информация выше верна. Сам ChatGPT был обучен с использованием обучения с учителем и обучения с подкреплением на текстах, собранных из разных источников в интернете.
Обучение с учителем в ThreatSlayer
Инструмент обнаружения угроз ThreatSlayer использует те же технологические принципы, которые сгенерировали текст, который вы только что прочитали, только мы применяем их для выявления вредоносных веб-сайтов. Это ИИ, который использует обучение с учителем из библиотеки SciKit Learn, и, как предложил ChatGPT, мы убедились, что используем его эффективно.
Даже в рамках обучения с учителем существуют разные подходы к обучению ИИ в зависимости от ваших целей. Вы можете обучить его классифицировать объекты, найти связи между объектами или прогнозировать тренды на основе прошлых данных. Эти подходы известны как алгоритмы классификации, регрессии и прогнозирования соответственно.
Алгоритм
Для ThreatSlayer мы используем особенно эффективный алгоритм классификации и регрессии, известный как Дерево решений.Алгоритм очень хорошо справляется с определением, относится ли случайное изображение к определенной категории на основе имеющейся информации. В нашем случае он может выявлять ключевые характеристики веб-сайта, которые могут указывать на его вредоносность.
Данные
Но, как бы ни был хорош алгоритм, без правильных данных он не принесет большой пользы. Мы обучили ThreatSlayer на больших наборах данных, включающих известные криптовалютные скамы, фишинговые ссылки, опасные URL-адреса, вредоносное ПО и многое другое.Как и в примере с фруктами, мы убедились, что ThreatSlayer стал очень хорош — даже лучше, чем человек — в обнаружении вредоносных веб-сайтов, тестируя его и корректируя на основе его выхода.Еще важнее, что мы будем продолжать обучать его на все большем количестве данных по мере роста сообществ ThreatSlayer и Bouncer. Каждый новый сообщенный вами угроза укрепит алгоритм и сделает его лучше в выявлении и прогнозировании действий злоумышленников.
Зачем использовать ИИ для обнаружения угроз?
Еще раз, ИИ очень хорош в имитации того, как мы думаем о вещах. Так же, как вы используете калькулятор, чтобы избежать расчетов на салфетке каждый раз, когда делите счет в ресторане, вы можете использовать алгоритм ИИ для выявления угроз. Это помогает вам чувствовать себя немного спокойнее при просмотре — особенно когда у вас есть средства в вашем Web3 кошельке.Также помогает то, что этот конкретный ИИ обновляется информацией о новых угрозах из интернета благодаря активному (и мотивированному) сообществу. Вы не просто перекладываете часть своего мозга, которая всегда начеку, на ИИ, но и доверяете это коллективному разуму, который видел и распознал больше угроз, чем вы хотели бы потратить на это время.Мы действительно считаем, что если мы улучшаем веб с помощью децентрализации, мы также должны поднять безопасность на новый уровень. ИИ — это правильный инструмент для этого.
Оставайтесь в безопасности
Не упускайте из виду безопасность ваших средств, когда вы перемещаетесь как в Web2, так и в Web3. Подписывайтесь на нас в Twitter, чтобы быть в курсе того, как мы улучшаем наш ИИ, и, если вы еще этого не сделали, скачайте ThreatSlayer сегодня.