Des recherches révolutionnaires sur c'est ce qu'elle a dit

L'efficacité et la longévité surprenantes du désormais légendaire c'est ce qu'elle a dit blague, récemment popularisée à nouveau avec l'aide de Le bureau , a fait plus que fournir à des millions de personnes une réponse instinctive à une conversation informelle. Il a maintenant atteint un nouveau niveau de signification sociale, en inspirant de sérieuses recherches linguistiques. Il se présente sous la forme d'un document de recherche intitulé C'est ce qu'elle a dit : l'identification à double entité , rédigé par deux étudiants en informatique, Chloé Kiddon et Yuriy Brun .

Dans leur article, le duo décrit leur création du Double Entender via Noun Transfer ou DEviaNT approche qui identifie automatiquement c'est ce qu'elle a dit (TWSS) blagues. Ils appellent leur approche l'analyse métaphorique, porteuse d'un double sens qui lui est propre et basée sur la pondération de certains mots comme plus sexy que d'autres. L'équipe a pondéré plusieurs noms et verbes sexy, puis a exécuté son algorithme.

Dans leurs recherches, le couple a également découvert des règles intéressantes pour les blagues TWSS. Par exemple, le risque d'invoquer une blague TWSS de manière incorrecte. De leur étude :

Par exemple, dans un contexte social, le coût de dire ce qu'elle a dit de manière inappropriée est élevé, alors que le coût de ne pas le dire alors que cela aurait pu être approprié est négligeable.

Pour résoudre ce problème et produire de meilleurs résultats, l'équipe a utilisé un algorithme d'apprentissage. Entre autres choses, cela a placé la création de faux positifs 100 fois plus élevée que les faux négatifs.

Après avoir exécuté DEviaNT à travers une série de blagues TWSS pré-identifiées et de citations aléatoires. Dans leur test, ils ont utilisé 1,5 phrase érotique et 57 000 phrases non érotiques. L'équipe affirme avoir atteint un taux de réussite supérieur à 71,4 %. Bien que cela puisse sembler peu, l'équipe dit qu'avec un ensemble de données plus important, elle s'attendrait à des résultats plus proches de 99,5 %. De plus, DEviaNT a renvoyé des résultats intéressants. Encore une fois, de l'étude:

DEviaNT a renvoyé 28 de ces phrases (toutes à égalité pour le plus probablement être un TWSS), dont 20 sont de vrais positifs. Cependant, 2 des 8 faux positifs sont en fait des TWSS (malgré les données de test négatives): Oui, donnez-moi toute la crème et il est parti. et ouais mais son trou sent vraiment parfois.

Certains peuvent nuire à cette recherche, la qualifiant simplement d'alouette et de peu de valeur. Ce serait une attaque de faible intensité, car même les chercheurs décrivent leur travail comme un problème difficile de compréhension du langage naturel. (C'est ce qu'elle a dit.)

( Nouveau scientifique passant par L'Evasion )