Bonjour à toutes et à tous. 🙂

Il ne se passe pas un jour sans que le coronavirus SARS-CoV-2 n’agite la toile et les médias. Aujourd’hui, c’est un Prix Nobel de Médecine et Physiologie qui « lance un pavé dans la mare », en clamant haut et fort sur plusieurs médias que le coronavirus qui cause actuellement une pandémie mondiale a été modifié en laboratoire et contient des gènes originaires du VIH, afin de le rendre plus dangereux encore (Addendum: on me souffle que Luc Montagnier suggérait que c’était au cours du processus de fabrication d’un vaccin, mea culpa si j’ai mal interprété ses propos). En bon scientifiques qui se respectent, vérifions ces propos avant de donner notre avis dessus… Sait-on jamais, il est Prix Nobel non ?

Je vous le dis, cet article sera bien plus court qu’à l’accoutumée. Par ailleurs, il se concentrera exclusivement sur cette assertion que le coronavirus actuel contient des séquences issues du VIH et ne s’intéressera pas à ce qui a pu être dit sur l’électromagnétisme pour guérir le Covid-19.

Le coronavirus SARS-CoV-2 et le VIH

Le SARS-CoV-2 vu par microscopie électronique à transmission. Crédits : NIAID

Je ne vais pas vous faire une description exhaustive du coronavirus SARS-CoV-2. C’est un membre de la grande famille des coronavirus, il a émergé fin 2019 à Wuhan, en Chine, et qui a causé la pandémie mondiale de Covid-19. Les coronavirus forment une famille de virus dite « à ARN positif » car leur matériel génétique est constitué d’ARN et non pas d’ADN. Il est dit positif car la machinerie cellulaire de fabrication des protéines de son hôte (nous par exemple) va directement utiliser l’ARN du virus pour fabriquer des protéines.

Le virus de l’immunodéficience humain (VIH) est à l’origine de la pandémie mondiale de Syndrome de l’ImmunoDéficience Acquise, ou SIDA. Il a été identifié dans les années 80 par plusieurs équipes au niveau international, dont celle du Professeur Luc Montagnier. Ce virus, bien qu’il soit lui aussi à ARN positif, est de la famille des rétrovirus. Contrairement aux coronavirus, les rétrovirus vont recopier leur ARN sous forme d’ADN et l’encastrer dans le génome de leur hôte, au sein des cellules infectées. Ce sont deux virus de familles très éloignées et dont les cycles viraux sont également très différents. Il existe d’ailleurs deux types de virus du VIH appelés respectivement VIH-1 et VIH-2 et qui sont passés de l’animal à l’homme à deux moments différents (1). Le VIH-1 est le plus répandu et un de ses sous-groupes est responsable de la majorité de la pandémie du SIDA. Le VIH-2 est plus limité géographiquement aux pays africains ou ayant des liens étroits avec l’Afrique (comme le Portugal et la France). D’évolution plus lente, il pose toutefois des problèmes car il présente plus de résistances aux traitements utilisés dans le cadre du SIDA.

Les séquences génétiques du SARS-CoV-2 et du VIH

Les séquences génétiques du VIH sont connues depuis de nombreuses années et celles du SARS-CoV-2 ont été obtenues rapidement après la découverte du pathogène, début janvier. Toutes les deux sont donc disponibles sur Pubmed, la plateforme du NIH. aussi, je vous propose qu’on aille y faire un tour pour vérifier les dires de monsieur Montagnier.

Commençons par trouver les séquences de génomes complets que l’on souhaite comparer…

Bon, les séquences sont disponibles en bas de chaque page (les ATCG sans fin là), mais comme le génome du VIH fait 10 000 nucléotides de long et celui du coronavirus en fait 30 000, j’ai beaucoup de bonne volonté, mais on va pas s’amuser à tout comparer à la main hein… Si votre confinement est VRAIMENT trop long, ma foi, amusez-vous.

Moi, je vais utiliser un outils magique qui s’appelle BLAST (pour Basic Local Alignment Search Tool). En gros, on lui donne une séquence et il cherche les points communs entre les deux séquences. Parfait pour ce que l’on cherche ! Comme ce sont des acides nucléiques (de l’ARN en l’occurrence), je vais réaliser un BLASTn pour essayer de comparer mes 3 séquences. Je vais choisir l’algorithme qui me permet de trouver le maximum de similarités entre mes séquences, même si elles sont très différentes les unes des autres. Et je lance l’analyse… SUSPENSE !

Cinq secondes plus tard, voici le résultat :

Résultat du BLASTn entre le SARS-CoV2 et le VIH-1 et le VIH-2.

Croyez-le ou non, mais l’algorithme a effectivement trouvé des séquences communes entre le SARS-CoV-2 et les VIH ! C’est donc vrai ? C’est une machination, un virus créé par l’homme ? La ressemblance entre les séquences s’étale sur une longue approximative de… 0% de la taille des séquences (le carré rouge). Comment est-ce possible ?! Regardons le détail des alignements.

Alignements d’un BLASTn entre le HIV-2 et le SARS-CoV-2

Voici le résultat pour l’alignement avec le VIH-2. On voit que les nucléotides identiques sont mis l’un en face de l’autre. L’algorithme à trouvé deux endroits où ces séquences peuvent se ressembler. Il y a quelques points à soulever :

Le premier endroit où il y a une séquence qui se ressemble fait… 21 nucléotides de long (1 sur la photo). Et encore, dedans il faut remplacer deux nucléotides pour que ça se ressemble. Rappelons que les génomes de ces virus sont longs de dizaines de milliers de paires de bases hein…

On remarque un second endroit long de 14 nucléotides lui (2). C’est déjà pas bien long, mais en plus ce n’est pas sur le brin en lui même qu’existe cette ressemblance, comme le montre le point 3 sur la photo : c’est seulement si on fait le brin complémentaire (donc les A deviennent des T, les C deviennent des G…) qu’on retrouve cette ressemblance…

Je pense qu’on peut classer cette ressemblance entre le SARS-CoV-2 et le VIH-2 parmi les « pas convaincantes« . Quid du VIH-1 ?

Alignements d’un BLASTn entre le HIV-1 et le SARS-CoV-2

Première constatation, deux des alignements se font entre les brins que j’ai donnés (Strand Plus/Plus) et deux entre un brin que j’ai donné et un brin complémentaire (Strand Plus/Minus)… Et dans les deux cas, on se retrouve de nouveau avec des aliments de 14 à 29 nucléotides (avec des mutations au milieu). Toujours pas convaincant.

Soyons rigoureux dans notre paranoïa

Bon, à ce stade là, on a déjà montré que la séquence génétique du SARS-CoV-2 ne contient pas de séquences du VIH. Mais soyons un peu tordus. Il est possible que plusieurs séquences génétiques différentes aboutissent à la même chaîne d’acides aminés et donc à la même protéine.

Donc, comme nous sommes des gens qui allons au bout des choses, je vais comparer les séquences des acides aminés des protéines des VIH-1/VIH-2 et celles du SARS-CoV-2. Je vais réaliser ce qu’on appelle un BLASTp en mettant comme un bâtard les séquences des différentes protéines dedans. Ces séquences dites codantes (CDS) sont situées dans les pages de Pubmed que je vous ai données plus haut. Le tableau des références utilisées est situé en annexe ci-dessous. 🙂

Du coup ? trouve-t-on des alignements protéiques entre les protéines du SARS-CoV-2 et du VIH ? Oui. On en trouve 162 ! Finalement, est-ce là la preuve que ce virus a bien été modifié pour coder des protéines du VIH ? C’est pas si simple…

Un peu comme on l’a vu avec les gènes plus haut, ce n’est pas parce qu’on trouve un alignement possible que cet alignement signifie quoi que ce soit. Et 162 alignements sur 38 x 33 = 1 254 comparaisons… C’est peut-être du bruit de fond. Pour vérifier cela, je vais regarder deux choses : la longueur des alignements trouvés et le pourcentage d’identité (c’est à dire à quel point ces alignements sont identiques).

Premièrement, constatons que la majorité des alignements trouvés sont plutôt courts, avec des séquences ressemblantes de quelques dizaines d’acides aminés de long tout au plus. Mais il y a des séquences très longues ! Quid du pourcentage d’identité ?

Bon, non seulement les alignements ne sont (pour la plupart) pas très longs, mais en plus, le pourcentage d’identité est bas (voire tout pourri), moins de 50% d’identité pour la vaste majorité des alignements… C’est un peu comme les alignements qu’on avait trouvé au niveau des séquences nucléiques : l’algorithme a dit qu’ils se ressemblent un peu parce… Ben c’est comme le dessin de ton gosse quoi : « Papa il a 2 jambes et 2 bras » mais s’il ne t’avait pas dit que c’était papa, tu l’aurais pas deviné. Mais on remarque qu’il y en a qui sont vachement élevés ! Avec plus de 60% voire 100% !

Mais… est-ce que c’est parce que les séquences qui ont une identité élevée sont très courtes ? Genre les deux virus ont une protéine avec 4 acides aminés pareil à un endroit ou un autre ? Et celles qui sont longues ont des identités plutôt basses ?

Ben oui. C’est exactement ça. On a des séquences très courtes d’acides aminés qui se ressemblent pas mal, mais plus ça devient long et moins ça se ressemble. Ce sont des faux-positifs, du bruit de fond. Genre la photo ci-dessous où une séquence longue de 16 acides aminés a 38% d’identité… un peu pour rien (les espaces blancs et les + marquent des acides aminés différents).

Exemple d’un des alignements long de 16 acides aminés avec 38% d’identité

La séquence protéique la plus longue (183 acides aminés) entre les deux virus trouve une ressemblance entre une enzyme du VIH appelée polymérase, qui transcrit un brin d’acides nucléiques complémentaire à un brin qu’on lui donne. Toujours sur le même principe de mettre un A en face d’un T, un C en face d’un G et vice-versa. Le BLASTp trouve qu’une enzyme du SARS-CoV-2 ressemble beaucoup à cette polymérase du VIH, et cette enzyme s’appelle Nsp3 (pour protéine multi-domaine non-structurelle 3). Cette enzyme est essentielle pour la réplication du virus… On peut supposer qu’elle code pour une enzyme qui a une fonction de polymérase aussi. Et elle n’a que 24% d’identité avec celle du VIH.

Alignement entre une polymérase du VIH et Nsp3 du SARS-CoV-2

Conclusions

Ne sur-interprétons pas nos données. Nous ne pouvons pas conclure ici quant au fait que ce virus ait, ou non, été manipulé en laboratoire, voire modifié pour le rendre plus virulent.

Par contre, très clairement, on ne trouve ni la séquence génétique du VIH dans celle du SARS-CoV-2, ni des ressemblances fortes entre les protéines de ces deux virus. Il est donc largement improbable que quiconque ait modifié le SARS-CoV-2 pour y intégrer des protéines du virus causant le SIDA.

Annexes

Référence 1 : https://cns.sante.fr/wp-content/uploads/2017/01/experts-vih_diversite.pdf

Tableau des protéines comparées :

Références des protéines du SARS-CoV-2 Références des protéines du VIH-1/2 YP_009724389.1 NP_663784.1 YP_009725297.1 NP_056837.1 YP_009725298.1 NP_056839.1 YP_009725299.1 NP_056840.1 YP_009725300.1 NP_056841.1 YP_009725301.1 NP_056842.1 YP_009725302.1 NP_056843.1 YP_009725303.1 NP_056844.1 YP_009725304.1 NP_056845.1 YP_009725305.1 NP_057849.4 YP_009725306.1 NP_787043.1 YP_009725307.1 NP_789740.1 YP_009725308.1 NP_705926.1 YP_009725309.1 NP_705927.1 YP_009725310.1 NP_789739.1 YP_009725311.1 NP_705928.1 YP_009725295.1 NP_057850.1 YP_009742608.1 NP_579876.2 YP_009742609.1 NP_579880.1 YP_009742610.1 NP_579882.1 YP_009742611.1 NP_579881.1 YP_009742612.1 NP_787042.1 YP_009742613.1 NP_579883.1 YP_009742614.1 NP_057851.1 YP_009742615.1 NP_057852.2 YP_009742616.1 NP_057853.1 YP_009742617.1 NP_057854.1 YP_009725312.1 NP_057855.1 YP_009724390.1 NP_057856.1 YP_009724391.1 NP_579893.2 YP_009724392.1 NP_579894.2 YP_009724393.1 NP_579895.1 YP_009724394.1 NP_057857.2 YP_009724395.1 YP_009725318.1 YP_009724396.1 YP_009724397.2 YP_009725255.1 Tableau contenant les références des séquences protéiques du SARS-CoV-2 et du VIH-1/2