martes, julio 13, 2010

Introducción a LINQ parte 2 (Arquitectura)

En esta ocasión veremos los conceptos en los que se basa LINQ y los cambios que se han hecho en VB y C# para darle soporte.

La mayoría de nosotros hemos usado lenguajes de un dominio específico ( DSLs – Domain-Specific Languages). Estos son lenguajes diseñados para un dominio específico como procesadores de palabras (macros), bases de datos relacionales (SQL), WebBrowsers (Javascript), etc. Gran variedad de estos lenguajes son implementados a través de generadores de código gráfico y wizards. Las herramientas que liberó Microsoft para Visual Studio 2005 y Visual Studio 2008 para dominios específicos como Aplicaciones Web, SmartClients, Mobile se basan en el concepto de DSLs. (Software Factories)

Por ejemplo SQL es un lenguaje para un dominio especifico que tiene que ver con la manipulación de datos en una base de datos relacional, y para este hay varios sabores o implementaciones como T-SQL (Microsoft), PL/SQL (Oracle), a estos lenguajes se les denomina DSQLs.

El problema con todos estos lenguajes es que en la gran mayoría de los casos las aplicaciones que desarrollamos necesitan de alguna manera manipular datos almacenados en algún motor de base de datos por lo que debemos conocer SQL y nuestro lenguaje de propósito general como VB o C# y traducir nuestras sentencias del lenguaje de programación a “otro lenguaje”. Lo que nos resta productividad y nos causa problemas. De allí que el grupo de LINQ se enfocó en tratar de resolver este problema.

Como lo describió el arquitecto de C# “LINQ es un modelo de programación para consultar, transformar y agrupar cualquier tipo de dato que comúnmente se manipula en una aplicación intensiva de datos , ya sea un objeto, relacional o XML”.

Aunque LINQ no es un DSQL, existen varias implementaciones de LINQ para dominios específicos como:

LINQ to Objects:

La implementación default, que permite hacer consultas a objetos en memoria.

LINQ to SQL:

Para consultas de SQL Server, incluye un diseñador DSL gráfico y una herramienta O/RM.

LINQ to DataSet:

Para consultar ADO.Net DataSet tipados y no tipados.

LINQ to XML:

Para consultar documentos XML.

LINQ to Entities:

Para consultar EntitySets definidos en un Entitity Data Model en Entity Framework.

LINQ es el responsable de las extensiones hechas a los lenguajes en Visual Studio 2008. En el siguiente artículo veremos en detalle los cambios hechos a C# 3.0 y VB 9.0 por el momento menciono la lista de cambios:

  • Variables Implícitas
  • Inicializadores de Objetos
  • Inicializadores de Arreglos
  • Inicializadores de Colecciones
  • Tipos Anónimos
  • Métodos de Extensión
  • Expresiones Lambda
  • Operadores Estándar de Consulta
  • Expresiones de Consulta
  • Arboles de Expresión

LINQ también se basa en características de C# 2.0 y VB 8.0 como:

  • Tipos Genéricos
  • Métodos Anónimos
  • Iteradores

Hasta la próxima.

Introducción a LINQ (Language Integrated Query)

Vamos a dividir esta serie de artículos en 3 partes:

1. Arquitectura e implementación

2. Ejecución (LINQ to Objects)

3. Operadores avanzados y expresiones

Breve Historia de LINQ

Para comenzar hablemos un poco de historia. Los conceptos de LINQ se originan en lenguajes de programación funcional como Haskell, que se basa en el cálculo lambda (otros lenguajes funcionales conocidos son LISP, APL, Erlang, ML y Scheme). Podemos decir que los lenguajes imperativos como C# o VB procesan las acciones para realizar una tarea en una serie de pasos, en lugar de ejecutar una secuencia de pasos los lenguajes funcionales evalúan expresiones. En estos lenguajes el desarrollador especifica lo que debe realizar el programa no como debe hacerlo.

Por ejemplo SQL es un lenguaje de consultas que emula a un lenguaje funcional, una sentencia SQL define las tuplas que se quieren obtener o actualizar, y el motor de base de datos decide como realizar las tareas solicitadas.

El cálculo lambda es una aproximación matemática formal para definición de función, aplicación y recursión, y es referido en Haskell y otros lenguajes funcionales como funciones lambda. Haskell y otros lenguajes funcionales manejan conceptos como funciones, closures, inferencia de tipos, lazy evaluation, monads (un método flexible para combinar operaciones I/O con lazy evaluation). En el Microsoft Research se trabajó en lenguajes experimentales como X#, Xen y finalmente CѠ ( c-omega). El objetivo de este lenguaje era reducir el ROX (Relational-to-Objects-to-XML) impedance mismatch agregando conceptos y operadores del dominio relacional y XML como una extensión a C#. Microsoft libero una versión preliminar del compilador de CѠ a mediados del 2004.

Algunos miembros del equipo de X#/Xen/CѠ se unieron al grupo que trabajo en LINQ ,en el cual Anders Helsberg (Arquitecto de Pascal, Delphi, J++, C#) quería añadir “operadores de secuencia” a C# para que los desarrolladores los aplicaran a colecciones que implementaran el tipo genérico IEnumerable<T> . Erick Meijer, uno de los diseñadores de Haskel98 y llamado creador de LINQ, comenzó a hacer propaganda sobre el presente y futuro de las versiones de LINQ en algunas conferencias técnicas.

La primera versión preliminar salió en septiembre de 2005 durante el PDC 2005. En septiembre de 2006 se lanzo la CTP. y en la versión CTP de enero de 2007 de VS2008 (orcas) se incluyó un add-on para el compilador de Visual Studio. La versión RTM de VS2008 no incluyó significantes cambios a LINQ. La versión final de Visual Studio 2008 SP1 incluyo la versión 3.5 del .Net Framework con soporte para EF, EDM y LINQ en Agosto de 2008.