Mieux comprendre la technologie que nous utilisons pour attraper les mauvais acteurs - d'où elle vient, comment elle fonctionne et pourquoi nous l'utilisons.
L'intelligence artificielle fait fureur ces derniers temps, et pour cause. Les récentes avancées dans ce domaine produisent des résultats impressionnants dans tous les domaines, depuis les voitures autonomes et les aspirateurs automatiques jusqu'à la reconnaissance d'images et de langues. La sécurité en ligne est sans aucun doute un domaine dans lequel vous souhaitez tirer parti de l'intelligence artificielle pour garder une longueur d'avance. Mais comment en sommes-nous arrivés là, comment l'IA fonctionne-t-elle et pourquoi est-elle utile dans ce domaine?
Ce dont nous parlons quand nous parlons d'IA
Commençons par le commencement. L'IA est souvent utilisée comme un fourre-tout pour un certain nombre de disciplines différentes qui comprennent la robotique ainsi que l'apprentissage automatique et ses sous-domaines comme les réseaux de neurones artificiels et le traitement du langage naturel.Bien que cela ne soit pas nécessairement faux, il convient de comprendre sa véritable signification. À la base, l'intelligence artificielle fait simplement référence à la simulation de la pensée humaine par un ordinateur.C'est ce qui a été proposé à l'origine en 1939 sous la forme de la thèse Church-Turing. La version simple de cette thèse est que tant que nous pouvons donner à un ordinateur une explication étape par étape de la façon dont nous pensons à quelque chose, l'ordinateur sera capable de reproduire ce processus indéfiniment.Plus important encore pour nous, lorsque l'ordinateur exécute ce processus encore et encore, nous pouvons l'entraîner à faire de petites améliorations et à « apprendre » en cours de route. Cela permet à l'ordinateur de devenir très bon - et même meilleur que nous - pour imiter des choses que nous faisons naturellement, comme la reconnaissance des formes.
Reprenons l'exemple précédent:Nous pourrions disposer d'une IA capable d'identifier les types de fruits. Il suffirait d'entraîner l'ordinateur à partir d'un ensemble de photos de fruits accompagnées de leurs étiquettes correspondantes (par exemple, pomme, banane, orange).Sa tâche consiste à faire correspondre les motifs qu'il voit dans chaque image à l'étiquette correspondante, tout seul. Après de nombreuses tentatives au cours desquelles nous évaluons les résultats et fournissons un retour d'information, l'ordinateur commence à reconnaître les caractéristiques visuelles de chaque type de fruit.Il peut alors être utilisé pour classer de nouvelles images inédites de fruits dans l'un des types connus. Par exemple, lorsqu'on lui présente une nouvelle image de fraise, l'ordinateur sera capable de l'identifier correctement comme étant une fraise. Cela fonctionnera même si cette image ne figurait pas dans l'ensemble de données avec lequel il a été formé.C'est ce que nous appelons l'apprentissage automatique. Les applications les plus populaires, comme ChatGPT, utilisent une version similaire pour comprendre et générer du texte.
Différents types d'apprentissage automatique
Bien entendu, il existe de nombreuses façons d'« apprendre » à la machine à faire ces choses. Pour s'amuser, demandons à ChatGPT d'expliquer les différents types de techniques d'apprentissage avec lesquelles les algorithmes comme le sien sont formés (je n'ajouterai que les en-têtes pour une meilleure lisibilité) :En matière d'apprentissage automatique, il existe quatre types d'algorithmes distincts : supervisé, semi-supervisé, non supervisé et de renforcement. Examinons chacun d'entre eux de plus près.
Apprentissage supervisé
L'apprentissage supervisé consiste pour le système à utiliser des ensembles de données étiquetées afin d'en tirer des enseignements en reconnaissant des modèles ou des corrélations entre différentes variables. Ce type d'algorithme nécessite de nombreux exemples de paires entrée/sortie afin que lorsqu'une entrée inconnue est rencontrée, la sortie correcte puisse être prédite.
Parmi les applications courantes de l'apprentissage supervisé figurent les systèmes de reconnaissance faciale, les logiciels de reconnaissance vocale, les systèmes de détection des fraudes à la carte de crédit et les programmes de traitement du langage naturel (NLP).
Apprentissage non supervisé
Les algorithmes d'apprentissage non supervisé sont utilisés lorsqu'il n'existe pas de données de formation étiquetées. Dans ce cas, l'algorithme doit apprendre en utilisant l'analyse de grappes ou d'autres méthodes pour identifier des modèles dans les données d'entrée sans aucune aide des étiquettes. Les applications courantes comprennent la segmentation de la clientèle et les systèmes de détection des anomalies.
Apprentissage semi-supervisé
L'apprentissage semi-supervisé combine des aspects de l'apprentissage supervisé et non supervisé. Il utilise des données étiquetées pour acquérir une compréhension initiale du système, mais s'appuie ensuite sur des données non étiquetées pour affiner ses connaissances.
Ce type d'algorithme est souvent utilisé lorsqu'il y a une abondance de données non étiquetées disponibles et une pénurie de données étiquetées. Les exemples incluent la reconnaissance d'objets dans les images et la classification de textes.
Apprentissage par renforcement
L'apprentissage par renforcement, également connu sous le nom de RL, diffère de tous les autres algorithmes de ML car il permet au système d'apprendre par essais et erreurs. Le système est récompensé lorsqu'il prend des décisions correctes et pénalisé lorsqu'il commet des erreurs, l'objectif étant de trouver une solution optimale.
Les applications de l'apprentissage automatique comprennent la robotique, les jeux et les véhicules autonomes.Quel que soit le type d'algorithme d'apprentissage automatique que vous choisissez d'utiliser, n'oubliez pas qu'il est important de comprendre le fonctionnement de chacun d'entre eux afin de vous assurer qu'ils sont utilisés correctement et efficacement. Bonne chance !...Oui, toutes les informations ci-dessus sont correctes.
ChatGPT lui-même a été formé à l'aide de l'apprentissage supervisé et de l'apprentissage par renforcement sur du texte récupéré sur Internet.
Apprentissage supervisé dans ThreatSlayer
L'outil de détection des menaces de ThreatSlayer utilise les mêmes principes technologiques que ceux qui ont généré le texte que vous venez de lire, sauf que nous les utilisons pour détecter les sites Web malveillants.
Il s'agit d'une IA qui utilise l'apprentissage supervisé de la bibliothèque SciKit Learn et, comme l'a suggéré ChatGPT, nous avons veillé à l'utiliser efficacement.Même dans le cadre de l'apprentissage supervisé, il existe différentes approches pour entraîner l'IA en fonction de vos objectifs. Vous pouvez l'entraîner à classer des objets, à trouver des relations entre des objets et à prévoir des tendances en fonction de données antérieures. On parle alors d'algorithmes de classification, de régression et de prévision.
L'algorithme
Pour ThreatSlayer, nous utilisons un algorithme de classification et de régression particulièrement efficace, connu sous le nom d'arbre de décision.
L'algorithme est très efficace pour décider si une image aléatoire appartient à une catégorie spécifique en fonction des informations dont il dispose déjà. Dans notre cas, il peut se concentrer sur les caractéristiques clés d'un site web qui peuvent indiquer s'il est malveillant ou non.
Les données
Mais quelle que soit la qualité de l'algorithme, il ne peut pas faire grand-chose sans les bonnes données. Nous avons entraîné ThreatSlayer sur de vastes ensembles de données d'escroqueries cryptographiques connues, de liens de phishing, d'URL dangereuses, de logiciels malveillants, etc.
Comme dans l'exemple du fruit, nous avons veillé à ce que ThreatSlayer devienne très performant - voire meilleur qu'une personne - pour détecter l'apparence d'un site web malveillant en le testant et en le corrigeant sur la base de ses résultats.
Plus important encore, nous continuerons à l'entraîner avec de plus en plus de données au fur et à mesure que les communautés ThreatSlayer et Bouncer se développeront. Chaque nouvelle menace signalée renforcera l'algorithme et le rendra plus apte à attraper et à prédire ce que les mauvais acteurs sont en train de faire.
Pourquoi utiliser l'IA pour la détection des menaces ?
Encore une fois, l'IA est très douée pour imiter notre façon de penser. Tout comme vous utilisez votre calculatrice pour éviter les calculs sur la serviette de table chaque fois que vous partagez l'addition au restaurant, vous pouvez utiliser un algorithme d'IA pour faire du repérage. Cela vous permet d'être un peu plus à l'aise lorsque vous naviguez, en particulier lorsque vous transportez des fonds dans votre portefeuille Web3.
De plus, grâce à une communauté engagée (et motivée), cette IA est mise à jour avec des informations sur les nouvelles menaces en provenance d'Internet. Vous ne vous déchargez pas seulement de la partie de votre cerveau qui est toujours à l'affût des menaces, vous la confiez également à un cerveau collectif qui a vu et reconnu plus de menaces que vous ne voudriez y consacrer de temps.
Nous pensons vraiment que si nous améliorons le web grâce à la décentralisation, nous devrions également monter d'un cran en termes de sécurité. L'IA est l'outil idéal pour cela.
Rester en sécurité
Ne perdez pas de vue la sécurité de vos fonds lorsque vous naviguez sur le Web2 et le Web3. Suivez-nous sur Twitter pour savoir comment nous améliorons notre IA et, si vous ne l'avez pas encore fait, téléchargez ThreatSlayer dès aujourd'hui.