Ncbix :: bigfetch

Recupere robustamente los conjuntos de resultados de secuencia NCBI muy grandes según las búsquedas de palabras clave usando NCBI Eutils
Descargar ahora

Ncbix :: bigfetch Clasificación y resumen

Anuncio publicitario

  • Rating:
  • Licencia:
  • Perl Artistic License
  • Precio:
  • FREE
  • Nombre del editor:
  • Roger A Hall
  • Sitio web del editor:
  • http://search.cpan.org/~rogerhall/

Ncbix :: bigfetch Etiquetas


Ncbix :: bigfetch Descripción

Recupere robustamente los conjuntos de resultados de secuencia de NCBI muy grandes según las búsquedas de palabras clave usando NCBI Eutils NCBIX :: BIGFETT es un módulo Perl útil para descargar conjuntos de resultados muy grandes de secuencias de NCBI dadas una consulta de texto. Su primer uso tuvo más de 11,000,000 secuencias como resultado de una sola búsqueda de palabras clave. Utiliza YAML para crear un archivo de configuración para mantener el estado del proyecto en caso de que la red o los problemas del servidor se interrumpe la ejecución, en cuyo caso se puede reiniciar fácilmente después de que los últimos datos descargados se organizan por "ID de proyecto" y "directorio base" y guardados en los archivos de texto. Cada archivo incluye la ID del proyecto en su nombre. Las teclas Project_ID y BASE_DIR son las únicas claves requeridas, aunque obtendrá la misma búsqueda de "apoptosis" cada vez que también establezca la tecla "Query". En cualquier caso, una vez que se inicia un proyecto, solo necesita que los dos parámetros se vuelvan a cargar. Besides los archivos de datos, se guardan otros dos archivos: 1) El resultado de búsqueda inicial, que incluye la clave de WebEnv, y 2) un archivo de configuración , que guarda los datos analizados y se usa para recoger la descarga y recuperar los lotes o secuencias que faltan. Se invierten en lotes en lotes dependiendo de la tecla "return_max". De forma predeterminada, el "índice" comienza a 1 y las descargas continúan hasta que el índice excede "CUENTO". Errores de ocasión ocasionalmente. En este caso, el "índice" se agrega a la lista "Falta". Esta lista se guarda en el archivo de configuración. Los lotes que faltan deben descargarse todos los días, y no guardar hasta el final de la ejecución completa. Los scripts de trabajo se incluyen en el directorio de secuencias de comandos: Fetch-all.pp Fetch-Feet-Feet.pp Fetch-inavailable.pp El flujo de trabajo recomendado es: 1. Copie los scripts y edítelos para un proyecto específico. Use un nuevo número como ID del proyecto. 2. Comience a descargar ejecutando FETCH-ALL.PP, que primero enviará una consulta y guardará la clave WebEnv resultante en un archivo de configuración específico del proyecto (usando YAML). 3. A la mañana siguiente, mate el proceso Fetch-all.pp y ejecute a Fetch-Feking.pp hasta que se complete. 4. Reinicie Fetch-all.pp. Si desea volver a descargar secuencias "No disponible", puede ejecutar Fetch-inavailable.pp. Sin embargo, se descargarán al final de la FetCH-ALL.PP si se completa normalmente. Si su conjunto de resultados de consulta es tan grande que su WebEnv se salga, simplemente inicie un nuevo proyecto con ese último índice del proyecto anterior, y recogerá el conjunto de resultados desde allí (con un nuevo webV). (La actualización planificada iniciará automáticamente otra búsqueda). ADVERTENCIA: Puede perder una (muy) pocas secuencias si su descarga se extiende a través de múltiples proyectos. Sin embargo, nuestras pruebas muestran que los lotes generados con la misma consulta dentro de unos días se encuentran en gran medida idénticos. HSYNOPSIS Use NCBIX :: BIGFETT; # Parámetros My $ params = {project_id => "1", base_dir => "/ home / usuario / data", db => "proteinic", consulta => "apoptosis", return_max => "500"}; # Start Project My $ Project = NCBIX :: BigFetch-> Nuevo ($ params); # Me encanta el que estás con la impresión "Autores:". $ Proyecto-> Autores (). "\norte"; # Intentar todos los lotes de secuencias mientras ($ Project-> Resultados_waiting ()) {$ Project-> get_next_batch (); } # Consiga lotes faltantes mientras ($ Project-> Missing_Batches ()) {$ Project-> get_missing_batch (); } # Encuentre identificaciones no disponibles My $ IDS = $ Project-> noavailable_ids (); # Recuperar ID NO ADUCHABLE IDS FOREACH MY $ ID (@ $ IDS) {$ Project-> Get_Esquence ($ ID); } Requisitos: · Perl


Ncbix :: bigfetch Software relacionado

Scriptutil

Clase orientada a objetos para hacer que los scripts de línea de comando típicos sean más fáciles de escribir ...

135

Descargar