Guida per un laboratorio digitale connesso su AWS
Panoramica
Questa Guida aiuta a connettere strumenti di dati e file di sistema di laboratorio per le scienze biologiche al cloud AWS tramite Internet o una connessione diretta a bassa latenza. È possibile ridurre le spese di archiviazione per i dati a cui si accede con meno frequenza o renderli accessibili per attività di calcolo ad alte prestazioni in ambiti come la genomica e l’imaging, oltre ad altri carichi di lavoro intensivi, tutto su AWS.
Come funziona
Questo diagramma di architettura aiuta a imparare come connettere gli strumenti e i sistemi di laboratorio basati sui file per le scienze biologiche al cloud e fornire accesso e calcolo scalabili utilizzando Amazon Web Services (AWS).
Principi Well-Architected
Il diagramma dell'architettura sopra riportato è un esempio di una soluzione creata tenendo conto delle best practice Well-Architected. Per essere completamente Well-Architected, devi seguire il maggior numero possibile di best practice Well-Architected.
Con l’emergere di nuove origini dati e nuovi partner, è possibile impiegare diversi servizi di trasferimento dati per adattarsi a questi cambiamenti nei modelli di accesso. Per ambienti distribuiti su più siti, è possibile utilizzare Gateway di file S3 per effettuare il trasferimento mantenendo una cache locale per altre applicazioni. Transfer Family consente alle entità partner come le organizzazioni di ricerca a contratto (CRO) di caricare facilmente i risultati degli studi.
Per garantire la sicurezza dei dati, consigliamo di proteggere le credenziali degli account AWS e configurare account utente individuali mediante AWS Identity and Access Management (IAM), assegnando ad ogni utente solo le autorizzazioni necessarie per le proprie attività lavorative. Inoltre, consigliamo l’uso della crittografia a riposo; i servizi offrono invece la crittografia durante il trasferimento per impostazione predefinita.
DataSync utilizza uno o più endpoint VPC per garantire che, in caso una zona di disponibilità non sia disponibile, l’agente possa raggiungere un altro endpoint. DataSync è un servizio scalabile che si avvale di una gamma di agenti per spostare i dati. È possibile scalare le attività e gli agenti in base alla richiesta e alla quantità di dati da migrare.
DataSync registra log di tutti gli eventi su Amazon CloudWatch. Se un’attività non può essere completata, è possibile intervenire per comprendere meglio il problema e dove si verifica l’errore. Una volta completate le attività, è possibile avviare processi post-elaborazione per completare la fase successiva del processo della pipeline.
Amazon S3 offre un’infrastruttura di archiviazione estremamente durevole, progettata per l’archiviazione di dati mission-critical e primari.
L’archiviazione offerta da FSx per Lustre assicura latenze inferiori al millisecondo, throughput fino a centinaia di gigabyte al secondo e milioni di IOPS.
Grazie all’utilizzo di tecnologie serverless che scalano on demand, pagherai soltanto le risorse che utilizzi. Per ottimizzare ulteriormente i costi, puoi interrompere gli ambienti notebook in SageMaker quando non sono in uso. Se decidi di non utilizzare la dashboard di visualizzazione Amazon QuickSight, puoi scegliere di non implementarlo per risparmiare sui costi.
I costi di trasferimento dei dati si suddividono in due aree principali: DataSync, per il quale si applica una tariffa di trasferimento per GB, e dati trasferiti tramite Direct Connect o VPN. Inoltre, potrebbero essere addebitati costi aggiuntivi per le zone di disponibilità incrociata se vengono utilizzati endpoint VPC.
I parametri di CloudWatch offrono agli utenti la possibilità di prendere decisioni informate basate sui dati attraverso l’uso di avvisi e l’analisi delle tendenze. Tramite un ampio utilizzo dei servizi gestiti e della scalabilità dinamica, potrai ridurre al minimo l’impatto ambientale dei servizi di backend. La maggior parte dei componenti è autosufficiente.
Contenuti correlati
Dichiarazione di non responsabilità
Il codice di esempio, le librerie software, gli strumenti della linea di comando, le proof of concept, i modelli e le altre tecnologie correlate (comprese tutte le tecnologie di cui sopra fornite dal nostro personale) vengono forniti all'utente sotto forma di contenuto AWS ai sensi dell'Accordo cliente AWS o del relativo accordo scritto stipulato tra l'utente e AWS (a seconda dei casi). Non bisogna utilizzare il contenuto AWS in questione negli account di produzione o sui dati di produzione o altri dati fondamentali. L'utente è responsabile dei test, della sicurezza e dell'ottimizzazione del contenuto AWS, come il codice di esempio, in modo appropriato per l'utilizzo in produzione sulla base delle pratiche e degli standard di qualità specifici. La distribuzione del contenuto AWS potrebbe comportare costi AWS per la creazione o l'utilizzo di risorse AWS addebitabili, quali le istanze Amazon EC2 in esecuzione o l'archiviazione Amazon S3.
Hai trovato quello che cercavi?
Facci sapere la tua opinione in modo da migliorare la qualità dei contenuti delle nostre pagine