martes, 31 de enero de 2012

Archivos XML y Archivos CSV

eXtensible Markup Language


La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más practica y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien definidas, y que esas partes se componen a su vez de otras partes.  DE manera que sea simple el analisis e identificacion de cada una de esas partes que conforman la estructura. En este tipo de archivo se aplican las reglas establecidas por la tecnologia XML. 

Esta sintaxis impone cosas como la coincidencia de mayúsculas/minúsculas en los nombres de etiqueta, comillas obligatorias para los valores de atributo, etc. 
Por lo tanto  para ser mas seguro lleva a acabo una validacion, este analisis determina si un archivo tiene las restricciones y bases requeridos  por el esquema  utilizado para su construccion, aumentando el nivel de fiabilidad, presicion , funcionabilidad y utilidad.
El lenguaje estándar XML especifica unas normas básicas a nivel de sintaxis:

  •  se debe declarar r una declaración XML como etiqueta obligatoria:
  •  se informa  la versión XML  que se utiliza.

Ejemplo:


<? xml version="1.0" encoding="UTF-8" standalone="no" ?>

Se basa en una estructura jerárquica y su función es la misma que el elemento raíz de un documento HTML <HTML>Contenido</HTML>

  • Todos los elementos deben estar delimitados por una etiqueta inicial y otra final con el mismo nombre. <elemento></elemento>
  • Los valores de atributos en XML deben ir entre comillas simples o dobles.
  • Los elementos vacíos deben terminar con '/' (autocierre) o añadiendo una etiqueta de fin y no puede haber etiquetas aisladas.
  • XML es sensible a mayúsculas y minúsculas y los nombres de las etiquetas pueden ser alfanuméricos, pero siempre comenzando con una letra.

           Comma Separated Valu



Estos archivos resultan útiles a la hora de exportar datos desde una base de datos o hojas de cálculo ya que están formalizados en un estándar internacional. La terminología CSV viene del inglés “Comma-separated values” (Archivos separados por coma). Son archivos que tienen una estructura de filas y columnas separadas por comas muy parecidas a la estructura de una base de datos.

Para la creación de un archivo de tipo CSV se pueden utilizar aplicaciones como Excel, Access, etc., todas permiten crear un archivo en formato CSV

para poder importar archivos o documentos se debe de tener un  cierto tipo de estructura:


  • Cada línea representa un “registro”; en nuestro caso, una ficha bibliográfica, o parte de la misma.
  •  En cada línea, los distintos campos de información están separados por un carácter conveni-do de antemano , en general será una coma, pero se puede emplear el punto y coma, 
  •  Todas las líneas de un archivo dado deben tener la misma estructura; es decir, los mismos campos y en el mismo orden. 
  •  Aquellos campos que incluyan, o puedan incluir, en su contenido el carácter separador de-berán encerrarse entre comillas dobles (carácter “). 


s