En este white paper, describimos uno de los fundamentos clave para el diseño e implantación de una red de comunicaciones de datos fiable y resistente que pueda, en su mayor parte, ser autosuficiente y garantizar la disponibilidad continua de datos en cualquier sistema de misión crítica. Ese fundamento clave es el de prevenir los puntos simples de fallo.
¿Quién es Westermo?
Desde 1975, Westermo ha fabricado dispositivos de comunicaciones de redes industriales de misión crítica, en los que la fiabilidad, la solidez y la resistencia han sido la columna vertebral de todo lo que hacemos.
Westermo ofrece una gama completa de soluciones de comunicaciones de datos industriales para aplicaciones exigentes en los mercados del transporte, las redes ferroviarias, el agua y la energía, entre otros. Durante décadas, Westermo ha estado a la vanguardia del desarrollo tecnológico y a menudo ha superado los límites de lo posible. Con el fin de ofrecer la mejor asistencia posible, contamos con presencia local en más de 40 países de todo el mundo.
¿Qué es un punto simple de fallo?
Casi cualquier situación puede verse afectada por un punto simple de fallo. En una red de comunicaciones de datos, un punto simple de fallo es cualquier compo
nente que, si falla, puede impedir que todo el sistema funcione y se comunique. Puede tratarse de hardware, como un router o un conmutador, una fuente de alimentación o un cable. También puede ser la dependencia total de una conexión o servicio, como tu proveedor de servicios de Internet, tu conexión de banda ancha o tu proveedor de telefonía móvil o conexión 4G.
El punto simple de fallo puede ser la persona que diseña, implementa y mantiene la red. Todo el mundo es capaz de cometer errores, por lo que tener un segundo par de ojos para comprobar las cosas es siempre una buena idea.
Diseño de la red – Construir la resiliencia de la red desde cero.
La resiliencia de la red debe ser la base sobre la que construir su red de misión crítica. Cuando diseñe su red de misión crítica, haga de la resiliencia y la tolerancia al fallo una prioridad desde el principio. Una red que se construye con resiliencia desde el principio es mucho más fácil de mantener que una que se diseña sin ella, ya que añadir resiliencia a una red existente puede llevar mucho tiempo y ser costoso. Realizar cualquier cambio en una red existente a causa de un fallo puede precipitar las cosas. Sin las pruebas adecuadas, las alteraciones de la red pueden tener un efecto dominó en otros elementos de la red, lo que da lugar a una situación en la que se aplican continuamente parches para reparar las partes rotas de la red.
Las cosas pueden ir mal, es una realidad. Sin embargo, la mejor manera de evitar problemas es prevenirlos desde el principio. Diseñar, probar y buscar esos puntos simples de fallo desde el principio, comprobando su funcionamiento, sentará unas bases sólidas para todo lo demás.
Punto simple de fallo del hardware
¿Qué es un punto simple de fallo de hardware?
El punto simple de fallo de hardware es una situación en la que, si falla un elemento físico del sistema (por ejemplo, un enrutador o un conmutador), y no hay otro elemento que lo reemplace de forma automática, el resto de la red o la comunicación se interrumpirán.
Evitar un punto simple de fallo de hardware
Cuando se dispone de un único dispositivo de comunicaciones con varios canales, se puede pensar que la resilencia es total. Considere el siguiente diagrama. El router, es el único responsable de la comunicación con Internet, tiene un enlace DSL con un respaldo a 4G. Hay cierta resilencia en el hecho de que en caso de fallo de la banda ancha, 4G tomará el relevo. Sin embargo, si el router falla, se perderán todas las comunicaciones con Internet.
El siguiente diagrama muestra la misma red, pero en lugar de tener un router responsable de la conmutación por error, hay dos. El enrutador A es un enrutador DSL, el enrutador B es un enrutador 4G, y juntos garantizan que haya un reemplazo de funciones en caso de que se caiga el enlace de banda ancha. Esta red también puede garantizar que la comunicación con Internet continúe incluso si alguno de los routers se cae.
Fuente de alimentación redundante
Hay algunos conmutadores que permiten conectar dos fuentes de alimentación simultáneamente. La fuente de alimentación secundaria garantizará que el dispositivo siga recibiendo energía aunque falle la fuente de alimentación principal. Los generadores o las baterías de reserva son dos ejemplos de fuentes de alimentación de reserva. (Compruebe la potencia nominal del dispositivo para encontrar una fuente de alimentación adecuada).
Punto simple de fallo del software o la configuración
¿Qué es un punto simple de fallo de software o configuración?
Comenzar con los dispositivos de red físicos adecuados es clave para evitar un punto simple de fallo en el primer nivel. El siguiente paso es asegurarse de que la red está configurada correctamente, para poder supervisarla y tomar una acción de forma automática, como proporcionar una ruta alternativa en caso de que algo vaya mal con un dispositivo o un proveedor de red.
Evitar un punto simple de fallo del software
Aprenda qué protocolos de redundancia son apropiados para su entorno de red antes de adquirir sus dispositivos de red. Si la intención es mantener los dispositivos existentes en la red, averigüe qué protocolos a prueba de fallos soportan para poder adquirir dispositivos compatibles. A menudo es beneficioso permanecer con el mismo fabricante para poder disfrutar de compatibilidad e interoperabilidad. Tener la posibilidad de obtener asistencia técnica desde un único proveedor es otra ventaja.
Servicio como punto simple de fallo
Puede que no se le ocurra, pero si sólo utiliza un proveedor de servicios de red, tiene un punto simple de fallo. Considere la posibilidad de diversificar su proveedor de red. Por ejemplo, tener la capacidad de pasar de su proveedor de banda ancha a un proveedor de telefonía móvil, elimina ese punto simple de fallo. Del mismo modo, si su router 4G admite dos tarjetas SIM, puede diversificar tu proveedor de servicios utilizando tarjetas SIM de distintos proveedores de red. Las tarjetas SIM itinerantes también son una opción si su router las admite.
El último punto simple de fallo: las personas
¿Es usted el eslabón más débil? Tener a más de una persona controlando una red es siempre una buena idea. Otro par de ojos suele ser capaz de detectar puntos vulnerables que el primero no pudo ver. Debe existir un sistema para hacer frente a posibles cortes y garantizar que siempre haya alguien disponible para comprobar las notificaciones y alarmas. Y lo más importante: conozca su red.
Conclusión
- Una red sólida empieza por tener la mentalidad adecuada. Dé la máxima prioridad a la capacidad de recuperación de la red. Si no se da prioridad a la resiliencia en este punto o se recorta la inversión, podría acabar costando más a largo plazo debido a las costosas visitas al sitio, la falta de información o la falta de servicio.
- Conozca los objetivos de su red. Conocer el propósito de cada parte de la red y la dependencia que tienen las diferentes partes de la red entre sí, le ayuda a determinar dónde construir la resiliencia.
- Elimine todos los puntos simples de fallo. Identifique los riesgos potenciales realizando una evaluación de riesgos de punto simple de fallo en tres áreas principales: hardware, software/servicios y personas. Elabore una lista de comprobación en la que se detallen las áreas generales de evaluación.
- Evite depender de una sola persona para identificar los riesgos potenciales. La regla general es: dos pares de ojos son mejores que uno.
Este White Paper ha sido redactado por Julian Megson, Experto Técnico de Westermo en el Reino Unido. Las recomendaciones de este documento se basan en un profundo conocimiento de las tecnologías de comunicación de datos industriales y en la experiencia práctica adquirida en la asistencia a numerosas aplicaciones de clientes diferentes.
.