La Infraestructura Nacional de Genómica (NGI) de Suecia desarrolló una línea de análisis de datos genómicos y de secuenciación. La organización que la engloba, SciLifeLab, tiene una política de software libre.
Su intención es contribuir a los proyectos de software libre existentes y desarrollar sus propios para compartirlos.

El NGI de Estocolmo es un centro de investigación en el campo de la genómica. Como parte del SciLifeLab (Science for Life Laboratory, Suecia), siguen una estricta política de software libre. Uno de sus proyectos de código abierto más destacados es Sarek, un flujo de trabajo para detectar variaciones en el genoma de cualquier especie. Los genomas identificados también están disponibles como datos públicos.
SciLifeLab es un recurso nacional de conocimientos e investigadores en áreas de biomedicina, ecología y evolución. El NGI se ocupa principalmente de la tecnología para la secuenciación paralela masiva y el genotipado y apoya a los investigadores en Suecia con apoyo bioinformático.
La genómica es el estudio de todos los genes de una persona (el genoma), incluidas las interacciones de genes entre sí y con el entorno de la persona.
Según la política de software libre de SciLifeLab, los servidores funcionan con código abierto y el software debe ser liberado bajo una licencia que fomente la transparencia y la cooperación en la sociedad académica. Uno de los programas informáticos que desarrolló el NGI es Sarek. Anteriormente se conocía con el nombre de «Cancer Analysis Workflow» (CAW).
Sarek se basa en NextFlow, que permite los flujos de trabajo científicos mediante el uso de contenedores de software. Sarek detecta variantes en genomas completos u otros datos de secuenciación, tanto en la célula que forma el óvulo, el esperma y el óvulo fecundado como en las células somáticas. Realiza un preprocesamiento basado en las mejores prácticas del Genome Analysis Toolkit (GATK), luego identifica las variantes y después resume la información en un informe MultiQC. MultiQC es una herramienta de visualización que resume todos los datos en un informe HTML.
Al igual que las políticas de software libre sobre el software, los datos de investigación procesados por el pipeline de Sarek deben ser tratados como dominio público:
En la era de FAIR (Findable, Accessible, Interoperable and Reusable) y de la ciencia abierta, los conjuntos de datos deben ponerse a disposición del público, por ejemplo, enviando sus datos a un repositorio público.
