I farmaci per il Covid sono molto richiesti a livello internazionale ed i produttori fanno ovviamente fatica a stare dietro alle esigenze del mercato. A Giugno, per esempio, gli USA si sono preventivamente accaparrati il 90% della produzione del remdesivir, lasciando gli altri a bocca asciutta.

E se domani qualche azienda fosse a corto di una materia prima? Sarebbe bene avere delle ricette di riserva, al fine di produrre lo stesso composto attraverso una via differente, possibilmente mantenendo rese comparabili.

È proprio a questo punto che ci viene in soccorso Synthia, un software che sfrutta le strategie retrosintetiche apprese attraverso il machine learning per proporre sintesi alternative di sostanze già sul mercato o di candidati in sperimentazione.

synthia-onestep

Tim Cernak, dell'Università del Michigan, insieme al proprio gruppo di ricercatori ha impiegato il programma per proporre le sintesi alternative di 12 farmaci: figurano il remdesivir, l'umifenovir, il favirapavir ed altri. 1

Rettifica: 20 Agosto 2020 >

Nonostante il titolo di questo post, Synthia non usa algoritmi di Machine Learning per il calcolo del percorso retrosintetico. O meglio, forse ne fa uso ma in misura minore e non per la componente fondamentale del codice, che è ereditata da Chematica (Grzybowski et al.).

Come sottolineato da Gianmarco Ghiandoni sulla pagina Facebook, il software è rule-based, cioè calcola il percorso sulla base di migliaia di regole scritte a mano dai programmatori e non astrae queste regole da grossi dataset, come farebbe se fosse basato sul Machine Learning. Ad essere fuorviante è il fatto che l'azienda (Sigma Aldrich) parli di una non meglio precisata AI, termine che di solito è impiegato come sostituto marketing-friendly di Machine Learning. Tutta questa vaghezza dipende dal fatto che il codice non è aperto ed ha licenza commerciale, quindi non è possibile sapere nel dettaglio come funzioni. Qui vi riporto per completezza una tabella con alcuni software impiegati in sintesi, tra cui Chematica (Synthia). Nella seconda colonna potete leggere l'algoritmo sfruttato.2

MetodoAlgoritmoCodice sorgente
Jensen and colleaguesSimilarity search (no learning)Github
3N-MCTSMCTS + deep learningNo
Chematica (Synthia)Tree search + AI [?, NdR]No

Grazie a Gianmarco per la segnalazione e ad Alex Checco per aver concluso il thread in bellezza con questa vignetta di XKCD:

Trained a Neural Net

Non si può dire che Synthia-Chematica non utilizzi reti neurali, in fondo.