Decimos que un servidor es fiable si se encuentra en estado operativo.
Podemos aumentar la escalabilidad de un servidor añadiendo fuentes de alimentación redundantes.
Los procesadores para servidores suelen tener más canales de memoria que los de PC en la misma generación.
Las unidades de estado sólido (SSD) son capaces de alcanzar anchos de banda superiores a los que el protocolo SATA-3 puede proporcionar.
El primer procesador con un conjunto de instrucciones de 64 bits lo diseñó AMD a principios de los 2000.
La "S" del acrónimo SRAM es por Synchronous.
Puedo conectar una tarjeta PCle 2.0 en un conector PCIe 4.0 de la placa base, pero no al revés.
PCle 2.0 x4 tiene un ancho de banda de 2GB/s en cada sentido.
Puedo conectar un disco SATA usando el controlador SAS de la placa, pero no un disco SAS usando el controlador SATA de la placa.
SO-DIMM es un tipo de memoria pensada para servidores.
En la jerarquía de memoria de un computador, la memoria LLC tiene menor latencia que la DRAM.
El conjunto de instrucciones que ejecutan el auto-test de arranque (Power On self-test) se encuentran almacenadas en la ROM/Flash BIOS de la placa.
Para diagnosticar que una memoria RAM funciona correctamente debemos utilizar un benchmark específico para memorias RAM.
Si NT >> NT*
el servidor dejará de estar en equilibrio de flujo (para el caso de redes de colas cerradas).
La sección de garantías de un pliego de prescripciones se refiere esencialmente a la garantía en la realización del pago del contrato.
En un anuncio de licitación pública se debe aportar tanto los códigos CPV como la dirección de internet en la que estará disponible el pliego de condiciones.
Un módulo de DRAM DDR4 con ECC 2Rx4 tiene 36 chips.
Las tarjetas que usaban las ranuras ISA tenían que ser pre-configuradas para asignarles la interrupción que correspondía a cada una.
Podemos mejorar la escalabilidad de un servidor utilizando RAID 1.
Si una interfaz es Plug and Play podemos cambiar el componente en caliente (sin reiniciar).
Un SSD con MLC es menos fiable que uno SLC.
Un disco SAS usa un único conector que unifica tanto los cables de alimentación procedentes de la fuente de alimentación como los de datos, procedentes de la placa base.
Los chips de la serie AMD Opteron X son SoC.
AGP tiene más ancho de banda que PCI.
Con la Ley de Amdahl podemos estimar la ganancia en velocidad de la ejecución un único trabajo (un hilo) en un computador después de mejorar \(k\) veces un componente.
Las prestaciones de un servidor no se ven afectadas por la configuración de la memoria virtual.
La ganancia en velocidad siempre es un número comprendido entre 0 y 2, ambos inclusive.
El protocolo USB 2.0 es half-duplex.
El puente sur del chipset es el encargado de las transferencias entre el puente norte y el resto de periféricos con menores exigencias de velocidad de la placa.
En un test t, el \(p-value\) equivale esencialmente a la probabilidad de que la hipótesis nula sea falsa.
La hipótesis de partida de un test ANOVA
es que el factor que se está estudiando influye en el rendimiento.
Con "sar -u", sin más argumentos, iremos obteniendo la información de la utilización global del procesador desde el momento actual en adelante.
Un microbenchmark también suele denominarse benchmark de sistema completo.
Una ganancia (speedup) negativa quiere decir que la mejora aplicada ha empeorado el tiempo original.
EPYC es una familia de procesadores de AMD para servidores.
eDonkey es un ejemplo de Arquitectura Cliente/Servidor de varios niveles.
El zócalo para CPU de la figura es de tipo LGA.
AHCI es una interfaz diseñada para facilitar la conexión de SSD a través de PCIe.
En una placa base de un PC es habitual encontrar tanto conectores SATA como SAS.
La transmisión de información entre un módulo de memoria de tipo DDR4 y la CPU es half-duplex.
El módulo regulador de voltaje, entre otras cosas, convierte la corriente alterna en corriente continua.
SATA-3 usa codificación 128b/130b.
La precisión de un sensor se refiere esencialmente a cómo se aproximan las medidas que toma al valor verdadero.
Todos los protocolos de comunicación serie son full-duplex.
La utilidad principal de las unidades de cinta en servidores es para almacenamiento de respaldo (backup) y archivado.
PCIe permite la conexión serie punto a punto, una comunicación de tipo full-duplex y la conexión de dispositivos en caliente.
En un pliego de prescripciones técnicas no se debe hacer referencia a una fabricación o una procedencia determinada con la finalidad de favorecer o descartar ciertas empresas o ciertos productos. Si no es posible, se acompañará la mención «o equivalente».
En un test ANOVA
, si F_{exp}
es mayor que el grado de significatividad concluiremos que no podemos decir que el factor a considerar influya en la variable respuesta.
gprof
basa su información en lo que obtiene leyendo de /proc
.
El contratante es el licitador que resulta adjudicatario de la licitación y quien finalmente se encargará de llevar a cabo los trabajos contratados.
Los procesadores Intel Core i7 están especialmente diseñados para placas con dos o más zócalos de CPU.
Una memoria DRAM necesita refresco porque es volátil.
Si \(\sum\limits_{i=1}^{K} U_i > 1\) el servidor está saturado.
El conector de la figura proviene de una fuente de alimentación.
El índice SPEC premia mejoras sustanciales con respecto a algún programa del benchmark y no castiga al mismo nivel los empeoramientos.
La razón media de visita de un dispositivo no tiene por qué ser necesariamente un número entero no negativo.
Nota: números enteros no negativos son: \(0, 1, 2, 3, \dots\)
En la monitorización de un servidor durante un tiempo \(T\), \(C_0\) no puede ser mayor que \(A_0\).
\(R_i=W_i+Q_i\), para todo \(i=1..K\)
La versión serie del interfaz SCSI se llama SAS, cuyas siglas provienen de "Serial Attached SCSI".
Una red de colas abierta se puede considerar un caso particular de red de colas cerrada si hacemos que \(Z = 0s\).
El pliego de condiciones se divide en "pliego de cláusulas administrativas particulares" y "pliego de prescripciones técnicas".
AMD ofrece los procesadores EPYC para el mercado de sobremesa y los OPTERON para el de servidores.
La cola/pasta térmica es un aislante que evita que el calor salga de la CPU.
Las LR-DIMM se utilizan para caché de altas prestaciones en servidores.
Es el propio microprocesador en muchos computadores actuales el que realiza la función de puente norte del chipset.
El fenómeno llamado "timing skew" motivó la aparición de protocolos de comunicación paralelos como P-ATA (también llamado IDE) o PCI.
Existen servidores con fuentes de alimentación reemplazables en caliente (hot swappable).
Los conectores de la placa base de la figura podrían ser de tipo SATA.
Un servidor que siempre me da respuesta, pero que a veces me da respuestas incorrectas, tiene una disponibilidad del 100%.
Con “sar -P 1” puedo conocer el estado del proceso con id=1.
Cuando nos referimos al método USE para la monitorización del rendimiento de un servidor, la “S” de USE viene de “Saturation”.
Un zócalo PGA tiene agujeritos para que entren las patillas del procesador.
Una celda SRAM tiene más componentes electrónicos (condensadores, transistores...) que una DRAM.
Un microprocesador puede acceder a la vez a dos módulos de memoria del banco de un mismo canal.
PCle 5.0 usa codificación 8b/10b.
No solo se puede conectar una tarjeta PCIe 2.0 en una ranura PCIe 5.0 de la placa base, sino que también se puede conectar una tarjeta PCIe 5.0 en una ranura PCle 2.0 de la placa base.
A través del System Panel (o Front Panel) se puede conectar un dispositivo USB del chasis a la placa base.
Las placas de servidores suelen tener un conector VGA en el panel trasero.
\(N_0 = \sum\limits_{i=1}^K V_i \times N_i \)
Los pliegos de prescripciones técnicas en ningún caso contendrán declaraciones o cláusulas que deban figurar en el pliego de cláusulas administrativas particulares.
A la hora de escoger un servidor ateniéndonos únicamente al valor de la relación prestaciones/coste, es mejor escoger la versión con un valor numérico mayor.
Decimos que un módulo de DRAM tiene dos rangos si tiene chips por las dos caras (dualranked).
NCQ (Native Command Queuing) es una extensión de SATA concebida especialmente para optimizar el acceso a unidades de estado sólido.
Una de las líneas del protocolo PCIe se usa en exclusiva para transmitir la señal de reloj.
El puente sur del chipset se encarga de las líneas de PCIe x16.
La precisión de un sensor está relacionada con la dispersión de las medidas que realiza.
El indice SPEC no tiene unidades.
El pliego de prescripciones técnicas debe contener, con carácter general, la información sobre el plazo de ejecución o duración del contrato.
Puedo colocar una PCIe x16 en una x4 pero no al revés.
MTTF significa Mean Time To Failure.
PCI soporta Hot Plugging.
Ultra-SCSI no soporta Full-Duplex.
La ROM tiene el código para instalar los drivers que se usarán por el SO para funcionar normalmente.
Un servidor blade es más complejo que un rack.
Los procesadores Opteron son los procesadores de Intel para servidores.
El puente norte del chipset es el que se encarga de las transferencias de alta velocidad.
Llamamos "rango" a cada una de las caras de un módulo de memoria RAM.
La anchura de entrada de un monitor es la frecuencia máxima de la ocurrencia de los eventos.
En gprof
la columna self
de cada función incluye el tiempo de código propio (incluyendo el tiempo que tardan sus hijos en ejecutarse).
gprof
da información exacta (no estimada) del tiempo de ejecución de cada función de un programa instrumentado por esta herramienta.
Un monitor por eventos siempre da información exacta.
Medir los MIPS
es un buen índice de rendimiento.
En un call graph, las flechas indican el número de veces que una función llama a otra. Este número siempre es entero.
SPECrate, a diferencia de SPECspeed, mide cuántos programas se ejecutan por unidad de tiempo.
Si lanzo dos dados (sin truncar) muchas veces, la media de la diferencia entre los valores de sus lanzamientos debería tender a 0.
El tiempo de respuesta medio de un servidor es la suma de los tiempos de respuesta de las estaciones de servicio.
Si añado una nueva CPU a nuestro servidor, el tiempo mínimo medio de respuesta del servidor seguro que disminuye.
Las principales medidas de prestaciones de un servidor se basan en tiempos de respuesta (o latencias) y en productividades (o anchos de banda).
Todos los sistemas escalables son extensibles, pero no a la inversa.
Xeon es una familia de microprocesadores de IBM especialmente dirigida a los servidores.
El voltaje que usa un módulo DDR4 es menor que el de un módulo DDR3.
Las latencias de las unidades de cinta suelen ser muy bajas ya que hay que rebobinar la cinta hasta que el cabezal se encuentre en la posición deseada.
SAS es full-duplex.
En el panel trasero de la placa base de un servidor es habitual encontrar varios conectores para Ethernet.
A través del "System Panel" se puede conectar el altavoz del chasis a la placa base.
La pila que hay en la placa base sirve, entre otras cosas, para tener el reloj en tiempo real de dicha placa actualizado.
SSD procede de las siglas "Solid State Disk":
La placa base de la figura tiene una ranura PCI y 4 PCIe:
La placa base de la figura tiene al menos dos conectores mini-SAS:
La placa base de la figura admite hasta dos microprocesadores y un máximo de cuatro DIMM de memoria RAM dinámica en total.:
El puente sur del chipset se encarga de la comunicación con la DRAM
sar -d
en un servidor con sar
instalado, iremos obteniendo información sobre las transferencias de cada disco del servidor de forma interactiva.sar
es un monitor software por eventos. NT*
, entonces el servidor está saturado. NT >> NT*
el servidor está saturado (para colas cerradas)./proc
está almacenada realmente en la RAM.sar
al igual que top
es un monitor software por eventos.POST
se encuentra en la RAM.El contratante es el proponente que resulta adjudicatario de una licitación y quien finalmente se encargara de llevar a cabo los trabajos contratados.
Time skew es un protocolo de comunicación paralelo.
Si el servidor A es el doble de rápido que el servidor B para todos los programas de un benchmark cuyo rendimiento se calcula según el criterio SPEC, entonces ese índice SPEC del servidor A será mayor que el del servidor B, independientemente de la máquina de referencia elegida.
El conjunto de instrucciones que ejecutan el auto-test de arranque (Power On self-test) se encuentran almacenadas en las primeras direcciones de la DRAM.
Si aplicamos la ley de Little a los usuarios en reflexión de una red de colas cerrada Interactiva, podemos relacionar el número medio de usuarios en reflexión con la productividad media del servidor y el tiempo medio de reflexión de dichos usuarios.
Si un servidor web ha recibido una media de 10 visitas por segundo, entonces la razón media de visita del servidor es 10 tr/s.
Si añadimos una segunda CPU a nuestro servidor, idéntica a la ya existente, es razonable suponer que la razón media de visita de la primera CPU se va a dividir por dos.
\(W_i = N_i \cdot S_i\) es una ley válida para servidores modelados mediante una red de colas abierta en equilibrio de flujo.
Si el servidor A es un \(50\%\) más rápido que el servidor B en ejecutar un determinado programa de benchmark, entonces podemos decir igualmente que el servidor B es un \(50\%\) más lento que el servidor A en ejecutar dicho programa de benchmark.
Las memorias con ECC se usan para aumentar la disponibilidad de un servidor.
La frecuencia de reloj de las CPU sigue todavía incrementándose de forma exponencial con los años.
La placa base de la figura tiene 2 ranuras PCI, 3 PCIe y 6 conectores SATA.
La placa base de la figura solo admite una CPU y 4 DIMM de memoria RAM dinámica.
La transmisión de información entre un módulo de memoria de tipo DDR4 y la CPU es full-duplex.
El uso de Cloud Computing y de la virtualización facilita el diseño de servidores escalables.
Si la ganancia en velocidad (speedup o aceleración) entre dos servidores para un determinado programa es mayor que \(0\), es razonable concluir que uno de los servidores es más rápido que el otro para ese programa.
Con un benchmark especializado en DRAM puedo diagnosticar el correcto funcionamiento de un módulo de DRAM.
En una red de colas cerrada interactiva se cumple que: \(N_T = X_0^{max} \cdot (R_0^{min} + Z)\)
La siguiente figura puede corresponder a la evolución de la productividad media de un servidor modelado mediante una red de colas cerrada frente al número total de usuarios en dicha red.
Las memorias de tipo U-DIMM, al carecer de buffer/registro interno, son las que permiten albergar la mayor cantidad de memoria por módulo.
En una red abierta en equilibrio de flujo se cumple que \(R_0 = R_1 + R_2 + \dots + R_K\), siendo \(K\) el número de estaciones de servicio de nuestro modelo.
En Linux, el profiler gprof
utiliza monitorización por muestreo para estimar el tiempo de CPU que consume cada función de nuestro programa escrito en C.
Cuando comparamos tiempos de ejecución, expresados en segundos, de programas ejecutados en servidores utilizando el test t, el estadístico \(t_{exp}\) también se puede expresar en segundos.
Es posible conectar unidades de almacenamiento con interfaz SATA a una placa base con conectores SAS.
La celda básica de una SRAM es mayor que la de una DRAM.
La familia AMD Opteron X Series usa microprocesadores de ARM.
sar
es un monitor software por muestreo.
Después de instrumentar un programa con la herramienta gprof
, se ha obtenido el perfil plano (flat profile) que aparece en la siguiente tabla (note que hay algunas columnas que faltan y que el orden de las filas ha podido ser alterado). Se deduce que \(X_2\geq 10\ \text{ms}\).
Después de instrumentar un programa con la herramienta gprof
, se ha obtenido el perfil plano (flat profile) que aparece en la siguiente tabla (note que hay algunas columnas que faltan y que el orden de las filas ha podido ser alterado). Se deduce que \(X_3=40\).
En Google están intentando mejorar la técnica de distribución de carga de sus servidores de YouTube. Para ello, han realizado 100 medidas de la productividad media de los servidores durante un número determinado, pero fijo, de horas para las 2 configuraciones principales de distribución de carga: conf1
y conf2
. Como los experimentos se han realizado en presencia de aleatoriedad, han realizado un test-t. De los resultados, deducimos que para un \(80\%\) de nivel de confianza podemos afirmar que hay diferencias significativas y que la mejor configuración, según el criterio de la medida aritmética es conf1
.
En Google están intentando mejorar la técnica de distribución de carga de sus servidores de YouTube. Para ello, han realizado 100 medidas de la productividad media de los servidores durante un número determinado, pero fijo, de horas para las 2 configuraciones principales de distribución de carga: conf1
y conf2
. Como los experimentos se han realizado en presencia de aleatoriedad, han realizado un test-t. De los resultados, deducimos que para un \(99\%\) de nivel de confianza no hay diferencias significativas entre las productividades medias obtenidas por ambas configuraciones.
Un zócalo PGA tiene patillas para que se conecte el procesador.
Intel Core es la familia de microprocesadores de Intel especializada en PC.
PCI-X es una versión de PCI-Express.
Linpack y Dhrystone miden el rendimiento de operaciones con coma flotante, mientras que Whetstone mide el rendimiento de operaciones con enteros.
NVMe es un protocolo para conectar dispositivos SSD por PCIe.
USB 3.0 es Full-duplex
En SoC nos podemos comunicar directamente con la memoria RAM.
Los monitores de actividad por muestreo muestran informacion exacta
sar
solo mide párametros relativos a CPU
MIPS
es una medida de rendimiento fiable: si un equipo presenta valor mayor de MIPS
que otro, rendirá mejor en todos los programas.
El microbenchmark SPEC CPU 2017 mide las prestaciones de CPU, sistema de memoria y de compilador (C, C++, Fortran).
La ley de Little establece que el número promedio de clientes en un sistema estacionario es igual a la tasa promedio de llegada multiplicada por el tiempo promedio que pasa en el sistema y es válida si está en equilibrio de flujo.
La latencia es la cantidad de trabajo de un equipo, es decir, el número de trabajos completados entre el tiempo dedicado.
El zócalo de la figura es LGA.
Las frecuencias de los procesadores se han estabilizado desde la primera década del siglo XXI.
Las memorias de los PCs tienen ECC, a diferencia de las de los servidores.
EPYC es un procesador de Intel.
Una memoria dual-ranked puede tener hasta 4 rangos.
En un análisis estadístico como el de t Student, si el \(p-value\) es menor que el nivel de significatividad (alpha), entonces podemos rechazar la hipótesis nula.
SO-DIMM tiene un menor número de contactos que DIMM.
Cada LANE de PCIe está formada por 4 cables.
Los SSDs están hechos de condensadores.
La carga de sistema en Linux, que se muestra en uptime
, entre otros comandos, está formada únicamente por los procesos en estado running
y runnable
.