martes, 18 de junio de 2013

Computación Paralela

 Computación Paralela

• Tradicionalmente, los programas han sido escritos para cómputo secuencial  (serial):
              o Para ser ejecutados en un único computador que posee un único CPU.
              o Los problemas son resueltos por una serie de instrucciones ejecutada una después de la otra por                                    
                el CPU. Sólo una instrucción puede ser ejecutada en un instante de tiempo.

• La computación paralela es el uso simultáneo de múltiples recursos computacionales para resolver un problema computacional.

• Los recursos computacionales pueden incluir:

              o Un único computador con múltiples procesadores
              o Un número arbitrario de computadores conectados por una red
              o Una combinación de ambos.

• El problema computacional posee características tales como:

              o Ser particionado en partes discretas de trabajo que pueden ser resultas simultáneamente
              o Ejecutar múltiples instrucciones del programa en cualquier instante de  tiempo
              o Ser resuelto en un menor tiempo con múltiples recursos computacionales que con un único  
                 recurso computacional.
• Tradicionalmente, la computación paralela ha sido motivada por simulaciones numéricas de sistemas complejos, tales como:

              o Modelaje de clima
              o Reacciones químicas y nucleares
              o Bioinformática y genoma humano
              o Geología y Sísmica
              o Petróleo
              o Biomedicina
              o Manufactura

• En la actualidad, aplicaciones comerciales requieren el desarrollo de computadores más rápidos. Estas aplicaciones requieren el procesamiento de grandes cantidades de datos de diferentes maneras. Ejemplos: 

             o Base de datos paralelas, minería de datos 
             o Exploración de crudo 
             o Servicios de negocios basados en la WEB 
             o Diagnóstico asistido por computador 
             o Computación gráfica

Arquitectura de Von Neumann 

• Un computador de Von Neumann usa el concepto de programa-almacenamiento. El CPU ejecuta un programa que específica una secuencia de operaciones de  lectura y escritura en la memoria.


• Diseño Básico:

               o Memoria es usada para almacenar el programa y las instrucciones sobre los datos
               o Instrucciones del Programa son datos codificados que le dice al computador que hacer
               o Los datos es simplemente información a ser usada por el programa
               o La unidad de procesamiento central (CPU) obtiene instrucciones y/o datos de la memoria,        
                  decodifica las instrucciones y secuencialmente ejecuta éstas.

Taxonomía de Flynn 

• Existen diferentes maneras para clasificar los computadores paralelos. La clasificación más usada desde 1966 es llamada taxonomía de Flynn.
• La taxonomía de Flynn distingue la arquitectura computacional de los  multiprocesadores de acuerdo a como éstos pueden ser clasificados a través de  dimensiones independientes de Instrucciones y Datos. Cada una de estas  dimensiones puede tener sólo uno de dos posibles estados: Single o Multiple.
• La siguiente matriz define las cuatro posibles clasificaciones de acuerdo a Flynn.









Single Instruction, Single Data (SISD):

• Un computador serial (no-paralelo)
• Single instruction: Sólo un flujo de instrucción está actuando en el CPU durante cualquier ciclo de reloj
• Single data: Sólo un flujo de dato está siendo usado como entrada durante cualquier ciclo de reloj
• Ejecución Determínistica
• Ejemplos: muchos PCs y workstations de un sólo CPU




Single Instruction, Multiple Data (SIMD):

• Un tipo de computador paralelo
• Single instruction: Todas las unidades de procesamiento ejecutan la misma instrucción en cualquier ciclo de reloj
• Multiple data: Cada unidad de procesamiento puede operar en datos diferentes
• Conveniente para problemas caracterizados por un alto grado de regularidad, tal como procesamiento de imágenes
• Dos variedades: Arreglo de Procesadores y Vectorial
• Ejemplos:

          o Arreglo de Procesadores: Connection Machine CM-2, Maspar MP-1, MP-2
          o Vectorial: IBM 9000, Cray C90, Fujitsu VP, NEC SX-2, Hitachi S820



Multiple Instruction, Single Data (MISD):

• Pocas clases de este tipo de computadores
• Algunos ejemplos:
            o Filtros de múltiple frecuencia operando en una única señal
            o Múltiples algoritmos de criptografía actuando en un mensaje codificado.

Multiple Instruction, Multiple Data (MIMD):

• Actualmente, el tipo más común de computador paralelo
• Multiple Instruction: cada procesador puede ejecutar un flujo de instrucción  diferente
• Multiple Data: cada procesador puede estar trabajando con un flujo de datos diferentes
• Ejemplos: supercomputadores actuales, redes de computadoras "grids", multiprocesadores SMP - incluyendo algunos tipos de PCs.



Arquitectura de la Memoria en Computadores Paralelos

Memoria Compartida (Shared Memory) 

Características generales:

• Computadores de memoria compartida tienen en común la capacidad que todos los procesadores pueden acceder a la memoria como un espacio de direccionamiento global.



• Múltiples procesadores operan independientemente pero comparten los mismos recursos de memoria.
• Cambios en una localización de memoria realizados por un procesador son visibles a todos los otros procesadores.
• La sincronización es obtenida controlando la escritura y lectura a la memoria.
• Las máquinas de memoria compartida pueden ser divididas en dos clases principales basadas en los tiempos de acceso a memoria: UMA y NUMA.

Acceso Uniforme a Memoria (UMA):

• Representadas por multiprocesadores simétricos ( Symmetric Multiprocessor machines, SMP)
• Procesadores idénticos
• Tiempos de acceso igual a la memoria
• Algunas veces llamadas CC-UMA - Cache Coherent UMA. Coherencia de cache significa que si un procesador actualiza una posición en la memoria compartida, todos los otros procesadores conocen acerca de la actualización. La coherencia de cache es a nivel de hardware.

Acceso no Uniforme a Memoria (NUMA):

• Enlazando físicamente dos o más SMPs
• Un SMP puede directamente acceder a la memoria de otro SMP
• No todos los procesadores tienen igual tiempo de acceso a toda la memoria
• El acceso a la memoria es lento
• Si la coherencia de cache es mantenida, son llamados CC-NUMA - Cache Coherent NUMA

Ventajas:

• El espacio de direccionamiento global provee una facilidad de programación al usuario
• El intercambio de datos entre las tareas es rápido y uniforme debido a la proximidad de la memoria a los CPUs

Desventajas:

• La desventaja primaria es la pérdida de escalabilidad entre la memoria y CPUs. Agregar CPUs puede geométricamente aumentar el tráfico en la vía memoría compartida-CPU, y para sistemas con coherencia de cache, geométricamente aumenta el tráfico asociado con la administración de cache/memoria.
• El programador es el responsable para construir la sincronización que asegura un correcto acceso a la memoria global.
• Es costoso diseñar y producir máquinas de memoria compartida con un gran número de procesadores.

Memoria Distribuida (Distributed Memory) 

Características Generales:

• Los sistemas de memoria distribuida requieren una red de comunicación para conectar la memoria de los procesadores.

• Múltiples procesadores operan independientemente pero cada uno tiene su propia memoria
• La data es compartida a través de una red de comunicación usando pases de mensajes
• El usuario es el responsable de la sincronización usando pase de mensajes

• Ventajas

         • La memoria es escalable al número de procesadores. Un aumento de los procesadores, el tamaño
           de la memoria y el ancho de banda aumenta
         • Cada procesador puede rápidamente acceder a su propia memoria sin interferencia

• Desventajas

          • Dificultad para asignar estructuras de datos existentes a esta organización de memoria
          • El usuario es el responsable para enviar y recibir data a través de los procesadores

• Ejemplos:

          • nCUBE Hypercube
          • Intel Hypercube
          • TMC CM-5
          • IBM SP1, SP2
          • Intel Paragon

Memoria Compartida-Distribuida

• Memoria Distribuida
             • MPP - Massively Parallel Processor

• Memoria Compartida
             • SMP - Symmetric Multiprocessor
                                  • Procesadores idénticos
                                  • Acceso igual a la memoria
                                  • Algunas veces llamado UMA - Uniform Memory Access
                                  • o CC-UMA – Coherencia de Cache UMA
                                  • Coherencia de Cache significa que si un procesador actualiza una posición en
                                     la memoria compartida, todos los otros procesadores conocen acerca de la
                                     actualización.

              • NUMA - Non-Uniform Memory Access
                               • Algunas veces llamado CC-NUMA - Coherencia de Cache NUMA
                               • A menudo hecho enlazando dos o más SMPs
                               • Un SMP puede directamente acceder la memoria de otro SMP
                               • No todos los procesadores tienen igual tiempo de acceso a toda la memoria
                               • El acceso de memoria a través del enlace es lento
• Combinaciones
               • Múltiples SMPs son conectados por una red
                              • Los Procesadores dentro de un SMP se comunican vía memoria
                              • Requieren pase de mensajes entre SMPs
                              • Un SMP no puede directamente acceder a la memoria de otro SMP
               • Múltiples procesadores de memoria distribuida conectados a una gran  memoria compartida
                               • La transferencia de memoria local a memoria compartida es  transparente al usuario
                               • Diseño del futuro: con diferentes procesadores y su memoria local alrededor de una
                                 gran memoria compartida en una simple tarjeta.

Paradigmas de la Programación en Paralelo

Existen muchos métodos de programación en computadores paralelos. Lo más usados son pase de mensajes, paralelismo de datos y hebras:

• Pase de mensajes – el usuario hace llamadas a bibliotecas para explícitamente compartir información entre los procesadores.
• Paralelismo de datos – un particionamiento de la data determina el paralelismo
• Memoria compartida - múltiples procesos comparten un espacio de memoria común
• Threads (hebras, hilos)- un proceso teniendo múltiples (concurrentes) trayectorias de ejecución
• Modelo combinado – compuesto de dos o más de los presentados anteriormente

Computación Distribuida

           La computación distribuida es un campo de la informática que estudia los sistemas distribuidos. Un sistema distribuido es un sistema de software en el que los componentes ubicados en equipos en red se comunican y coordinan sus acciones mediante paso de mensajes. Los componentes interactúan entre sí con el fin de lograr un objetivo común. Hay muchas alternativas para el mecanismo de paso de mensajes, incluyendo conectores RPC similares y colas de mensajes. Tres características importantes de los sistemas distribuidos son: la simultaneidad de los componentes, la falta de un reloj mundial, y el fracaso independiente de los componentes. Un objetivo importante y el desafío de los sistemas distribuidos es la transparencia ubicación. Ejemplos de sistemas distribuidos varían desde sistemas basados en SOA para juegos multijugador masivos en línea para aplicaciones de igual a igual.

        Un programa de ordenador que se ejecuta en un sistema distribuido se llama un programa distribuido, y la programación distribuida es el proceso de escribir dichos programas.
          La computación distribuida también se refiere al uso de sistemas distribuidos para resolver problemas computacionales. En computación distribuida, un problema se divide en muchas tareas, cada una de las cuales se resuelve mediante uno o más ordenadores, que se comunican entre sí por el paso de mensajes.
            La palabra distribuye en términos como "sistema distribuido", "programación distribuida", y "algoritmo distribuido" se refería originalmente a una red informática donde los ordenadores individuales se distribuyen físicamente dentro de un área geográfica. Los términos se utilizan hoy en día en un sentido mucho más amplio, incluso refiriéndose a los procesos autónomos que se ejecutan en el mismo equipo físico e interactúan entre sí mediante paso de mensajes. Aunque no existe una definición única de un sistema distribuido, las propiedades que lo definen se utilizan comúnmente:
  • Hay varias entidades computacionales autónomas, cada una de las cuales tiene su propia memoria local.
  • Las entidades que se comunican entre sí mediante paso de mensajes.
En este artículo, las entidades computacionales se llaman ordenadores o nodos.
Un sistema distribuido puede tener un objetivo común, tales como la solución de un gran problema computacional. Alternativamente, cada equipo puede tener su propio usuario con las necesidades individuales, y el propósito del sistema distribuido es coordinar el uso de los recursos compartidos o proporcionar servicios de comunicación a los usuarios.
Otras propiedades típicas de los sistemas distribuidos incluyen los siguientes:
  • El sistema tiene que tolerar fallas en equipos individuales.
  • La estructura del sistema no se conoce de antemano, el sistema puede constar de diferentes tipos de equipos y vínculos de red, y el sistema puede cambiar durante la ejecución de un programa distribuido.
  • Cada equipo tiene sólo una visión incompleta limitada del sistema. Cada equipo puede conocer sólo una parte de la entrada.

LA COMPUTACIÓN PARALELA Y DISTRIBUIDA

Los sistemas distribuidos son grupos de ordenadores conectados en red, que tienen el mismo objetivo de su trabajo. Los términos "computación concurrente", "La computación en paralelo" y "computación distribuida" tienen una gran cantidad de superposición, y no existe una distinción clara entre ellos. El mismo sistema puede caracterizarse tanto como "paralelo" y "distribuido"; los procesadores en un sistema distribuido típico se ejecutan simultáneamente en paralelo. La computación paralela puede ser visto como una forma fuertemente acoplado particular de computación distribuida, y la informática distribuida puede ser visto como una forma de acoplamiento flexible de la computación en paralelo. Sin embargo, es posible clasificar casi sistemas concurrentes como "paralelo" o "distribuido" utilizando los siguientes criterios:
  • En la computación paralela, todos los procesadores pueden tener acceso a una memoria compartida para el intercambio de información entre los procesadores.
  • En computación distribuida, cada procesador tiene su propia memoria privada. La información se intercambia mediante el paso de mensajes entre los procesadores.

Historia

El uso de procesos concurrentes que se comunican mediante paso de mensajes tiene sus raíces en las arquitecturas de sistemas operativos estudió en la década de 1960. Los primeros sistemas distribuidos generalizadas fueron las redes de área local como Ethernet que se inventaron en la década de 1970.
ARPANET, el predecesor de Internet, se introdujo a finales de 1960, y ARPANET e-mail fue inventado en la década de 1970. E-mail se convirtió en la aplicación más exitosa de ARPANET, y es probablemente el primer ejemplo de una aplicación distribuida a gran escala. Además de ARPANET, y su sucesor, el Internet, otras redes informáticas primeros en todo el mundo incluido Usenet y FidoNet de 1980, ambos de los cuales se utiliza para apoyar los sistemas distribuidos de discusión.
El estudio de la computación distribuida se convirtió en su propia rama de la informática a finales de 1970 y principios de 1980. La primera conferencia en el campo, Simposio sobre los principios de la computación distribuida, se remonta a 1982, y de su homólogo europeo Simposio Internacional de Computación Distribuida se celebró por primera vez en 1985.

Aplicaciones

Hay dos razones principales para el uso de sistemas distribuidos y la computación distribuida. En primer lugar, la propia naturaleza de la aplicación puede requerir el uso de una red de comunicaciones que conecta varios ordenadores. Por ejemplo, los datos se produce en una ubicación física y que se necesita en otro lugar.
En segundo lugar, hay muchos casos en los que el uso de un único equipo sería posible en principio, pero el uso de un sistema distribuido es beneficioso por razones prácticas. Por ejemplo, puede ser más rentable para obtener el nivel deseado de rendimiento mediante el uso de un grupo de varios equipos de gama baja, en comparación con un solo equipo de gama alta. Un sistema distribuido puede ser más fiable que un sistema no distribuido, ya que no hay ningún punto único de fallo. Por otra parte, un sistema distribuido puede ser más fácil de ampliar y gestionar de un sistema de un procesador monolítico.
Ejemplos de sistemas distribuidos y aplicaciones de computación distribuida incluyen los siguientes:
  • Redes de telecomunicaciones:
    • Redes telefónicas y redes celulares.
    • Las redes de ordenadores como Internet.
    • Redes de sensores inalámbricos.
    • Los algoritmos de enrutamiento.
  • Las aplicaciones de red:
    • World Wide Web y peer to peer.
    • Juegos multijugador masivos en línea y comunidades de realidad virtual.
    • Bases de datos y sistemas de gestión de bases de datos distribuidas distribuida.
    • Sistemas de archivos de red.
    • Sistemas de procesamiento de información distribuidos, como los sistemas bancarios y sistemas de reservas aéreas.
  • Control de procesos en tiempo real:
    • Sistemas de control de aeronaves.
    • Sistemas de control industriales.
  • Computación paralela:
    • Computación científica, incluyendo la computación cluster y grid computing y varios proyectos de computación de voluntarios, ver la lista de proyectos de computación distribuida.
    • Distributed rendering de gráficos por ordenador.


Fundamentos teóricos

MODELOS

Muchas de las tareas que nos gustaría para automatizar mediante el uso de una computadora son de tipo pregunta-respuesta: nos gustaría hacer una pregunta y el ordenador debe producir una respuesta. En ciencias de la computación teórica, estas tareas se denominan problemas de cálculo. Formalmente, un problema de cálculo consiste en casos junto con una solución para cada instancia. Las instancias son las preguntas que nos podemos preguntar, y las soluciones son las respuestas a estas preguntas se desee.
Ciencias de la computación teórica trata de comprender que los problemas informáticos se pueden resolver mediante el uso de una computadora y la eficiencia. Tradicionalmente, se dice que un problema puede ser resuelto mediante el uso de un ordenador si podemos diseñar un algoritmo que produce una solución correcta para cualquier caso dado. Dicho algoritmo puede ser implementado como un programa de ordenador que se ejecuta en un ordenador de propósito general: el programa lee un ejemplo de problema de entrada, realiza algún cálculo, y produce como salida la solución. Formalismos tales como máquinas de acceso aleatorio o máquinas de Turing universales se pueden utilizar como modelos abstractos de un ordenador de propósito general secuencial de la ejecución de un algoritmo tal.
El campo de concurrentes y distribuidos de computación estudios preguntas similares en el caso de cualquiera de varios equipos, o un equipo que ejecuta una red de procesos que interactúan: que los problemas informáticos se pueden resolver en este tipo de red y la eficiencia? Sin embargo, no está del todo claro lo que se entiende por "resolver un problema" en el caso de un sistema concurrente o distribuido: por ejemplo, ¿cuál es la tarea del diseñador de algoritmo, y lo que es el equivalente concurrente o distribuida de manera secuencial computadora de propósito general?
El análisis que sigue se centra en el caso de varios equipos, aunque muchos de los problemas son los mismos para procesos concurrentes se ejecutan en un solo equipo.
Tres puntos de vista son de uso común:
 Algoritmos paralelos en el modelo de memoria compartida
  • Todas las computadoras tienen acceso a una memoria compartida. El diseñador algoritmo elige el programa ejecutado por cada equipo.
  • Un modelo teórico es las máquinas de acceso aleatorio paralelas que se utilizan. Sin embargo, el modelo PRAM clásica asume acceso síncrono de la memoria compartida.
  • Un modelo que se acerca más al comportamiento de los equipos con varios procesadores en el mundo real y que tenga en cuenta el uso de instrucciones de la máquina, tales como comparar y cambiar, es el de la memoria compartida asíncrona. Existe un amplio cuerpo de trabajo en este modelo, un resumen de lo que se puede encontrar en la literatura.
 Algoritmos paralelos en el modelo de paso de mensajes
  • El diseñador algoritmo elige la estructura de la red, así como el programa ejecutado por cada equipo.
  • Se utilizan modelos como circuitos booleanos y redes de clasificación. Un circuito booleano puede ser visto como una red de ordenadores: cada puerta es un ordenador que ejecuta un programa de ordenador extremadamente simple. Del mismo modo, una red de clasificación puede ser visto como una red de ordenadores: cada comparador es un ordenador.
 Algoritmos distribuidos en el modelo de paso de mensajes
  • El diseñador algoritmo sólo elige el programa de ordenador. Todos los equipos ejecutan el mismo programa. El sistema debe funcionar correctamente, independientemente de la estructura de la red.
  • El modelo utilizado es un gráfico con una máquina de estados finitos por nodo.
En el caso de los algoritmos distribuidos, problemas computacionales se relacionan generalmente con las gráficas. A menudo, la gráfica que describe la estructura de la red de ordenadores es la instancia de problema. Esto se ilustra en el siguiente ejemplo.

UN EJEMPLO

Considere el problema computacional de encontrar un color de un determinado gráfico G. diferentes campos puedan tener los siguientes enfoques:
 Algoritmos centralizados
  • El gráfico G se codifica como una cadena, y la cadena se da como entrada a un ordenador. El programa de ordenador encuentra una coloración de la gráfica, codifica la coloración como una cadena, y envía el resultado.
 Algoritmos paralelos
  • Una vez más, el grafo G se codifica como una cadena. Sin embargo, varios ordenadores pueden acceder a la misma cadena en paralelo. Cada equipo puede centrarse en una parte de la gráfica y producen una coloración para esa parte.
  • La atención se centra en el cálculo de alto rendimiento que aprovecha la potencia de procesamiento de varios equipos en paralelo.
 Algoritmos distribuidos
  • El gráfico G es la estructura de la red informática. Hay un ordenador para cada nodo de G y un enlace de comunicación para cada borde de G. Inicialmente, cada equipo sólo sabe acerca de sus vecinos inmediatos en el gráfico G; los equipos deben intercambiar mensajes entre sí para descubrir más acerca de la estructura de T . Cada equipo debe producir su propio color como salida.
  • La atención se centra en la coordinación de la operación de un sistema distribuido arbitraria.
Mientras que el campo de los algoritmos paralelos tiene un enfoque diferente que el campo de los algoritmos distribuidos, hay una gran cantidad de interacción entre los dos campos. Por ejemplo, el algoritmo de Cole-Vishkin para la coloración de grafos se presentó originalmente como un algoritmo paralelo, pero la misma técnica también se puede utilizar directamente como un algoritmo distribuido.
Por otra parte, un algoritmo paralelo puede ser implementado ya sea en un sistema en paralelo o en un sistema distribuido. El límite tradicional entre algoritmos paralelos y distribuidos no reside en el mismo lugar que el límite entre los sistemas paralelos y distribuidos.

MEDIDAS COMPLEJIDAD

En los algoritmos paralelos, sin embargo, otro recurso además del tiempo y el espacio es el número de ordenadores. De hecho, a menudo existe un trade-off entre el tiempo de funcionamiento y el número de equipos: el problema se puede resolver más rápido si hay más equipos que ejecutan en paralelo. Si un problema de decisión puede ser resuelto en el tiempo polilogarítmico mediante el uso de un número polinómico de procesadores, entonces el problema se dice que es en la clase de Carolina del Norte. La clase NC puede ser definido igualmente bien mediante el uso de la PRAM formalismo o circuitos booleanos - máquinas PRAM pueden simular circuitos booleanos de manera eficiente y viceversa.
En el análisis de algoritmos distribuidos, más atención se paga generalmente en las operaciones de comunicación de pasos de cálculo. Tal vez el modelo más simple de computación distribuida es un sistema síncrono, donde todos los nodos funcionan de manera unísono. Durante cada ronda de comunicación, todos los nodos en paralelo reciben los últimos mensajes de sus vecinos, realizan cálculos locales de su elección, y enviar nuevos mensajes a sus vecinos. En tales sistemas, una medida de complejidad central es el número de rondas de comunicación sincrónica necesarios para completar la tarea.
Esta medida de complejidad está estrechamente relacionado con el diámetro de la red. Sea D el diámetro de la red. Por un lado, cualquier problema puede ser resuelto computables trivialmente en un sistema distribuido en las rondas de comunicación síncrona aproximadamente 2D: simplemente reunir toda la información en un solo lugar, resolver el problema, e informar a cada nodo sobre la solución.
Por otro lado, si el tiempo de ejecución del algoritmo es mucho menor que D rondas de comunicación, a continuación, los nodos de la red deben producir su salida sin tener la posibilidad de obtener información acerca de las partes distantes de la red. En otras palabras, los nodos deben tomar decisiones coherentes a nivel mundial sobre la base de la información que está disponible en su vecindad local. Muchos algoritmos distribuidos se conocen con el tiempo de funcionamiento mucho más pequeño que rondas D, y la comprensión que los problemas pueden resolverse por tales algoritmos es una de las preguntas de investigación centrales del campo.
Otras medidas comúnmente utilizados son el número total de bits transmitidos en la red.

OTROS PROBLEMAS

Problemas computacionales tradicionales toman la perspectiva de que hacemos una pregunta, una computadora procesa la pregunta por un tiempo, y luego se produce una respuesta y se detiene. Sin embargo, también hay problemas en los que no queremos que el sistema deje nunca. Ejemplos de tales problemas incluyen el problema filósofos comedor y otros problemas de exclusión mutua similares. En estos problemas, el sistema distribuido se supone que coordine continuamente el uso de los recursos compartidos de modo que no se producen conflictos o bloqueos.
También hay retos fundamentales que son únicos para la computación distribuida. El primer ejemplo es retos que están relacionados con la tolerancia a fallos. Ejemplos de problemas relacionados incluyen problemas de consenso, la tolerancia a fallos bizantinos, y auto-estabilización.
Mucha de la investigación también se centra en la comprensión de la naturaleza asíncrona de sistemas distribuidos:
  • Sincronizador pueden ser utilizadas para ejecutar algoritmos sincrónicos en sistemas asíncronos.
  • Relojes lógicos proporcionan una causal pasado-antes de ordenar los acontecimientos.
  • Algoritmos de sincronización de reloj proporcionan sellos globalmente consistentes tiempo físico.

PROPIEDADES DE LOS SISTEMAS DISTRIBUIDOS

Hasta ahora, la atención se ha centrado en el diseño de un sistema distribuido que resuelve un problema dado. Un problema de investigación complementaria está estudiando las propiedades de un sistema distribuido dado.
El problema de la parada es un ejemplo similar en el campo de la computación centralizada: se nos da un programa de ordenador y la tarea consiste en decidir si se detiene o se queda para siempre. El problema de la parada es indecidible en el caso general, y la comprensión de forma natural el comportamiento de una red de ordenadores es por lo menos tan fuerte como la comprensión del comportamiento de un ordenador.
Sin embargo, hay muchos decidible, pero no es probable que exista un algoritmo eficiente que resuelve el problema en el caso de redes de gran tamaño.

Elección Coordinador

Para llevar a cabo la coordinación, los sistemas distribuidos emplean el concepto de coordinadores. El problema coordinador de elección es elegir un proceso de entre un grupo de procesos en diferentes procesadores en un sistema distribuido para actuar como el coordinador central. Existen varios algoritmos electorales coordinador central.

ALGORITMO BULLY

Cuando se utiliza el algoritmo de Bully, cualquier proceso envía un mensaje a la actual coordinador. Si no hay respuesta dentro de un plazo determinado, el proceso trata de elegir como líder.

CHANG Y ROBERTS ALGORITMO

El algoritmo de Chang y Roberts es un algoritmo de elección basado en anillo usado para encontrar un proceso con el mayor número de identificación único.

Arquitecturas

Varios arquitecturas de hardware y software se utilizan para la computación distribuida. En un nivel inferior, es necesario interconectar varias CPU con algún tipo de red, independientemente de si la red que se imprime sobre una placa de circuito o compuestos de dispositivos y cables de acoplamiento flexible. En un nivel superior, es necesario interconectar los procesos que se ejecutan en las CPUs con algún tipo de sistema de comunicación.
Programación distribuida normalmente cae en una de las varias arquitecturas básicas o categorías: cliente-servidor, la arquitectura de 3 capas, una arquitectura n-tier, objetos distribuidos, acoplamiento débil o estrecho acoplamiento.
  • Cliente-servidor: cliente inteligente de código contacta con el servidor de datos y formatea y lo muestra al usuario. Entrada en el cliente se compromete al servidor cuando representa un cambio permanente.
  • Arquitectura de 3 capas: tres sistemas de nivel mover la inteligencia de cliente a un nivel medio para que los clientes apátridas pueden ser utilizados. Esto simplifica la implementación de aplicaciones. La mayoría de las aplicaciones web son de 3 niveles.
  • arquitectura n-tier: n-tier se refiere por lo general a las aplicaciones web que más adelante sus solicitudes a otros servicios de la empresa. Este tipo de aplicación es el más responsable para el éxito de servidores de aplicaciones.
  • altamente acoplado: se refiere típicamente a un grupo de máquinas que trabajan estrechamente juntos, se ejecuta un proceso compartido en paralelo. La tarea se divide en partes que se realizan de forma individual por cada uno de ellos y luego poner de nuevo juntos para que el resultado final.
  • Intercambio de archivos: una arquitectura donde no hay máquina o máquinas que proporcionan un servicio o administrar los recursos de red especial. En cambio todas las responsabilidades se dividen de manera uniforme entre todas las máquinas, conocidas como pares. Los compañeros pueden servir a la vez como clientes y servidores.
  • Espacio sede: se refiere a una infraestructura que crea la ilusión de un espacio de direcciones único. Los datos se replican de forma transparente de acuerdo con las necesidades de aplicación. Desacoplamiento en tiempo, espacio y referencia se logra.
Otro aspecto básico de la arquitectura de computación distribuida es el método de comunicación y la coordinación de trabajo entre los procesos concurrentes. A través de diversos protocolos de paso de mensajes, los procesos pueden comunicarse directamente entre sí, por lo general en una relación maestro/esclavo. Alternativamente, una arquitectura de "base de datos-centric" puede permitir a computación distribuida que hacer sin ningún tipo de comunicación directa entre procesos, mediante la utilización de una base de datos compartida.


COMPUTACIÓN CUÁNTICA

Una computadora cuántica es un dispositivo informático que hace uso directo del fenómeno de la mecánica cuántica, como la superposición y el entrelazamiento cuántico, para realizar operaciones sobre datos.

Las computadoras cuánticas son diferentes de las computadoras tradicionales basadas en transistores. El principio básico detrás de la computación cuántica es que las propiedades cuánticas pueden ser usadas para representar datos y realizar operaciones sobre los mismos.

La computación cuántica se basa en el uso de qubits en lugar de bits, y da lugar a nuevas puertas lógicas que hacen posibles nuevos algoritmos. Una misma tarea puede tener diferente complejidad en computación clásica y en computación cuántica, lo que ha dado lugar a una gran expectación, ya que algunos problemas intratables pasan a ser tratables. Un modelo teórico es la máquina cuántica de Turing, también conocida como computadora cuántica universal.



En los últimos años, los ordenadores clásicos han experimentado un gran aumento en la velocidad de procesamiento. La miniaturización del tamaño de sus componentes ha facilitado el incremento de la densidad de los circuitos electrónicos que los integran. En 1995, Gordon Moore vaticinó que el número de transistores de un microprocesador se multiplicaría por dos cada dos años. Y esta ley, que se ha venido cumpliendo hasta ahora, cuenta con una limitación: cuando el tamaño de los transistores presenta medidas atómicas las leyes más fundamentales de la física cambian. Los electrones experimentan comportamientos cuánticos y pueden moverse entre distintas líneas de corriente por “efecto túnel”. Esto produce la aparición de fugas que interfieren en el funcionamiento del circuito. El progreso técnico llega a su fin

     ii

Pero los principios de la cuántica, que limitan la dimensión de los microcircuitos de los ordenadores clásicos, son el germen de una nueva revolución computacional. La física cuántica deja de ser una teoría abstracta, misteriosa y antiintuitiva para convertirse en útil, para ser clave en el desarrollo de una futura teoría de la información.  Los primeros físicos teóricos que, en las décadas de 1970 y 1980, propusieron aplicar los fenómenos cuánticos al terreno de la computación fueron Richard Feynmann, Paul Benioff, David Deutsch y Charles Bennett.



La primera computadora cuántica del mundo ya esta funcionando


La computación cuántica es un campo ampliamente investigado por laboratorios y empresas a lo largo y ancho del globo y aún nadie ha sido capaz de crear un prototipo realmente funcional.


En la computación tradicional (la que conocemos ahora desde los primeros ordenadores hasta los smartphones que llevamos con nosotros) todo se basa en millones de interruptores con dos únicos estados, representados como ceros o unos en lenguaje binario.

La computación cuántica trata de usar estados de las partículas elementales como método de computación. Lo complicado de esta rama de la ingeniería informática es que en mecánica cuántica no hay ceros ni unos. Una misma partícula puede ser un uno, un cero, o un uno y un cero simultáneamente. La idea es aprovechar los cambios en esas unidades fundamentales para, mediante complejísimas ecuaciones, lograr un procesador que resolvería en segundos lo que los superordenadores de hoy tardan horas.

Para lograr los estados cuánticos necesarios para este tipo de computación, los investigadores en esta tecnología han intentado manipular las partículas de diferentes maneras, desde suspenderlas en campos electromagnéticos a atraparlas sobre silicio.

martes, 11 de junio de 2013

Últimos días para participar en el:

XIV ENCUENTRO INTERNACIONAL VIRTUAL EDUCA COLOMBIA 2013

Evento cumbre de innovación educativa en Iberoamérica, una iniciativa de cooperación multilateral en materia de educación, innovación, competitividad y desarrollo, en la que participan 20 países.
Este encuentro es un escenario que posibilitará el intercambio, la reflexión y análisis de prácticas educativas nacionales e internacionales, en relación con las estrategias de consolidación del Sistema Nacional de Innovación Educativa con Uso de TIC.
No te lo pierdas, este lunes 17 de junio se dará inicio a este gran evento.

lunes, 10 de junio de 2013

Computación en Paralelo con Matlab

Mis estimados Colegas, Si desean acelerar sus aplicaciones paralelizando sus algoritmos y a superar los límites impuestos por la memoria de su computador, utilizando MATLAB y Simulink. Este Webinar en vivo es gratis y cuenta con demostraciones de aplicaciones, seguido por una sesión de preguntas y respuestas Q&A con Gerardo Hernández, ingeniero de aplicación de MathWorks. Computación en Paralelo con MATLAB Miércoles, 19 de Junio 11:00 AM EDT En esta sesión aprenderá como puede resolver problemas utilizando computadores con múltiples procesadores, núcleos y servidores. Introduciremos algunas herramientas de alto nivel que le van a permitir paralelizar sus algoritmos de MATLAB y ejecutarlas en múltiples procesadores. Por favor envíe este correo electrónico a sus colegas que puedan estar interesados en asistir a estos Webinar gratis. Contáctos: webinars@mathworks.com

viernes, 7 de junio de 2013

Las mejores Profesiones del mundo

La consultora estadounidense CareerCast..com realizo una clasificación de las mejores profesiones del mundo con 200 posiciones. Las categorías tomadas en cuenta para hacer la tipificación fueron: los ingresos, las oportunidades que ofrece el empleo y las exigencias físicas del mismo. el estudio se hizo tomando en cuenta los datos de la Oficina de Estadísticas del Trabajo y otras agencias gubernamentales. Los puestos están así: 1. Actuario. 2. Ingeniero Biomédico. 3. Ingeniero de Software. 4. Audiólogo. 5. Planificador Financiero. 6. Higienista Mental. 7. Terapeuta Ocupacional. 8. Optometrista. 9. Fisioterapeuta. 10. Analista de Sistemas Informáticos. (Tomado del Semanario Quinto Día, 10 al 17 mayo de 2013)