Blog
Canvi d'un disc al servidor gaudi
12/06/2020
Degut al tall de corrent d'ahir, un dels discs en RAID del servidor gaudi va començar a donar errors i el RAID no es podia reconstruir. Avui hem rebut un disc de substitució i demà dia 14 pel matí a les 08:00 procedirem a canviar-lo. L'aturada durarà com a molt 15 minuts i els serveis afectats seran els següents:
- servei DHCP (assignació dinàmica d'IP)
- servei primari de DNS (el secundari seguirà funcionant)
- servei de VMPS (assignació de VLAN a les rosetes)
- servei de llicències Simics
- servei de canvi de contrasenya
- servei d'alta d'IP
Actualització [08:10]: hem canviat el disc i reiniciat el servidor.
Actualització [10:22]: la reconstrucció del RAID ha finalitzat.
Caída de tensión eléctrica en el D6
12/06/2020
Hoy a media mañana ha habido una caída en la tensión del edificio D6. A 13:50 aprox. se ha restablecido totalmente el servicio.
Qué ha ocurrido? El SAI principal del D6 estaba averiado (llevamos unos días así en espera de unas piezas). Hoy ha venido el técnico a reparlo y al conectar la placa nueva la alimentación se ha venido abajo.
El fallo ha sido bastante importante ya que no sólo ha caído la alimentación de nuestro edificio sino la de parte del anillo del Campus Nord (otros dos edificios más).
Como dentro de dos semanas está previsto instalar un SAI nuevo se ha decidido eliminar éste ya que el riesgo de que vuelva a caer es demasiado grande (y realmente no saben dónde está la avería), así que se ha iniciado el bypass externo.
El bypass externo consiste en aislar electricamente el SAI de forma que éste no reciba ni envíe corriente. De esta forma podemos sustituirlo sin problema. Esta operación se puede realizar normalmente sin paso por cero, pero hoy nos ha vuelto a tirar la instalación.
Finalmente mantenimiento ha conseguido realizar el bypass y ahora, aunque no disponemos de SAI, al menos las conexiones son estables y no tenemos en el circuito ningún elemento que nos pueda producir malfuncionamiento.
Fallada del servidor de repositoris de codi
12/06/2020
El servidor code.ac.upc.edu, el qual allotja els repositoris de codi dels vostres projectes amb el programari Trac, svn, mercurial i git, ha patit un malfuncionament software aquesta matinada i ha estat necessari reiniciar-lo aquest matí a primera hora a les 8:09h.
Tot i que alguns serveis sí que han estat reestablerts, com ara la navegació pels repositoris mitjançant el Trac, el funcionament del propi repositori via el programari VCS corresponent no funciona correctament, i a hores d'ara no és possible efectuar operacions sobre el mateix.
Estem investigant quina és l'arrel del problema. En pic tinguem novetats al respecte actualitzarem convenientment aquesta entrada. Us demanem disculpes per les molèsties ocasionades.
* Actualització [14:10h]: Ja hem trobat i solucionat el problema. Es tractava d'una inconsistència al filesystem arrel de la màquina, que no havia deixat cap rastre als logs donat que ha forçat a muntar el read-only el sistema de fitxers. Un cop solucionats els errors, el servei ha estat completament reestablert.
Nova alarma de temperatura al CPD del D6
12/06/2020
Avui hem tornat a patir una pujada de la temperatura del CPD del D6 per avaria de l'aire condicionat que refrigera la sala. Afortunadament el màxim de temperatura assolit (37.9 graus) no ha fet necessària l'aturada d'emergència dels diferents servidors, i hem pogut reduir la temperatura del CPD i normalitzar-la en el transcurs del matí després de que els tècnics de manteniment revisessin de nou la màquina d'aire condicionat del D6.
Sembla clar que l'aturada elèctrica programada a tot el campus el dia 11 d'agost ha espatllat quelcom de l'aire condicionat de l'edifici. La màquina havia funcionat sense cap incidència durant més d'un any fins l'esmentada aturada. A partir de llavors ja hem tingut quatre avaries: el mateix dia 12 d'agost, el dia 22, ahir i finalment avui mateix...
Avaria del SAI del D6
12/06/2020
Com a conseqüència de l'alarma de temperatura d'ahir, un dels SAIs de l'edifici D6 s'ha avariat. Els tècnics ja han vingut a revisar-lo i confiem que ens facin arribar aviat un pressupost per a la reparació.
El SAI avariat està en bypass: això vol dir que deixa passar el corrent que li vé d'entrada, però que en cas de tall del subministrament, no proveirà corrent als equips que hi estiguin connectats. La majoria d'equips criítics del CPD ja tenen redundada l'alimentació elèctrica cap a ambdós SAIs de l'edifici.
En cas de tall del subministrament elèctric, a més de molts dels equips del CPD, també es veurien afectades totes les preses de corrent estabilitzada de l'edifici D6, que són alimentades precisament pel SAI avariat.
Problemes de temperatura al CPD del D6
12/06/2020
Aquest diumenge dia 4 s'han tornat a produir problemes de refrigeració a la sala de màquines del D6. La temperatura màxima enregistrada ha estat de 46.2 graus a les 17:10h. Arribats a aquest punt el sistema ha iniciat una aturada d'emergència de la majoria de serveis no crítics, cPanel i clusters inclosos, per tal de reduir el risc d'avaries hardware. També ha estat aturat el servidor de correu d'entrada. Tots els correus entrants han estat redirigits cap al servidor de correu de continuïtat.
A les 9:30h d'avui dilluns dia 5 la majoria de serveis ja han estat posats en marxa, i tots els correus entrants que ja han estat entregats al servidor de correu habitual. Falta el servei de cPanel, els clusters i alguns servidors secundaris no crítics (brull i grau) que no han arrencat correctament.
Hem creat una incidència a manteniment per a tractar d'aclarir per què la temperatura de la sala de màquines ha pujat d'aquesta manera. Presumiblement es tractarà d'un problema amb l'aire condicionat, que està fallant força sovint darrerament coincidint amb l'aturada elèctrica de tot el campus del mes d'agost.
* Actualització 10:15h: cPanel ha estat posat en marxa.
* Actualització 10:55h: Tots els serveis en funcionament.
Actualización de BSCW
12/06/2020
Hoy hemos actualizado la versión de BSCW y pasamos a tener la última disponible (BSCW 4.5.5).
Al integrarse en el nuevo sistema web, el URL oficial del servicio cambia a: http://www.ac.upc.edu/app/bscw (durante un tiempo habrá una redirección, pero es conveniente que actualicéis vuestro bookmark si lo usáis).
Con el nuevo URL ya no pasamos por el proxy antiguo que reescribía el HTML y que hacía que a veces desde las redes externas el BSCW no funcionara lo bien que sería de esperar.
Nueva versión de Webmail
12/06/2020
Hoy hemos puesto en marcha una nueva versión del servicio de acceso al correo vía Web:
- Seguimos usando Webmail aunque con la versión de software actualizada
- Ahora funciona en la nueva plataforma de ejecución en máquina virtual, monitorización, etc. Esto permite disminuir el tiempo sin servicio (por avería, actualizaciones, etc.).
- Acceso a través del nuevo sistema de Web (tal como publicamos ayer). El cambio visible es que el url siempre es "http://www.ac.upc.edu/app/webmail", aunque internamente el servicio lo ofrezca otro servidor.
El nou www ja està aquí
12/06/2020
Portem un temps dissenyant el que serà el nou servei del gw, especialment pel que fa al seu paper respecte al web. En aquest sentit avui hem posat en producció el nou www. Si no heu notat cap canvi és perquè els canvis que s'han produït no són visibles. Però aquests canvis ens facilitaran la reorganització de l'espai d'adreces dels diferents serveis web institucionals sota el paraigua de www. A més a més, això també ens permetrà eliminar el pas pel gw per accedir a la intranet.
Altre cop problemes amb l'aire condicionat
12/06/2020
Avui al matí s'ha tornat a produir un problema amb l'aire condicionat del centre de càlcul del D6 i la temperatura ha tornat a pujar per sobre dels 40 graus. Com a conseqüència hem hagut d'aturar els clústers i ventilar la sala fins que els tècnics de manteniment han pogut tornar a posar en marxa la refrigeració.
Ara mateix la sala s'està refredant i en pic haguem pogut comprovar que l'aire condicionat no s'atura i la temperatura baixa raonablement, tornarem a posar en marxa els clústers.
Actualització [13:45]: hem posat en marxa de nou els clústers, trets dels nodes més nous de salvat, que encendrem demà.
Actualització del disc centralitzat
12/06/2020
Aquest matí hem dut a terme una actualització del programari de gestió del disc centralitzat. L'actuació comprenia realment dues actualitzacions tant de software com de firmware de cadascun dels nodes del disc centralitzat, i ha tardat unes 5 hores en completar-se.
Afortunadament, gràcies a la configuració en cluster d'alta disponibiitat del sistema de disc centralitzat, l'actuació ha pogut efectuar-se sense interrupció del servei.
Aturada per problemes aire condicionat 12/08/2011
12/06/2020
Aquest matí al arribar ens hem trobat que la sala de màquines del D6 estava amb un temperatura superior als 40 graus en alguns punts, fet que havia provocat l'aturada automàtica dels serveis no crítics:
* Clusters
* Servidors de NFS, SMB, impressores, etc
El problema havia estat que amb l'aturada programada d'ahir dijous, el sensor de temperatura de l'aire condicionat s'havia espatllat. Els tècnics han vingut ràpidament a reparar-ho i a les 9:00 ja tornaven a estar en marxa tots els serveis excepte els clusters, que estem esperant que la sala agafi un llindar de temperatura adeqüat.
Actualització 11:00: Els clusters ferrer i salvat tornen a estar operatius.
Nou servidor de Windows
12/06/2020
Hem posat en marxa un nou servidor de windows anomentat 'amargos'. Les característiques del mateix són:
* S.O: Windows Server 2008 R2
* Memòria 4GB
* 200GB de disc.
* 100MB de quota d'usuari.
* Darreres versions dels paquets ofimàtics.
El servidor està en fase de proves ara mateix i podeu accedir a ell igual que ho feu a Robert o Sindreu.
Un cop finalitzada la fase de proves després de l'estiu, procedirem a actualitzar el servidor Robert per a que tingui les mateixes característiques que el nou servidor 'amargos'.
Reboot del servidor de continuïtat
12/06/2020
El proper dimecres dia 20 de juliol de 10 a 11h reiniciarem el servidor de continuïtat de correu i disc per a fer efectives unes actualitzacions instal·lades recentment, i també per a resoldre una incidència que hi ha actualment amb el mòdul de gestió remota.
Manteniment de la Intranet
12/06/2020
El proper dijous dia 14 de juliol realitzarem un manteniment software del servidor que allotja la intranet institucional. L'actuació començarà a les 8:00h. La intranet estarà completament aturada fins a les 10:00h. A partir de les 10:00h i fins a les 14:00h anirem restablint el funcionament de cadascuna de les aplicacions allotjades.
Aquest és el llistat d'aplicacions que es veuran afectades:
- Usuari únic
- Signatura electrònica
- Gestió docent
- Reports de recerca
- Gestió bibliogràfica
- Viatges
- Pantalles informatives
- Inventari
- Repositori de documentació d'Usuari únic
- Repositori de documentació de l'Equip directiu
- Reserves de sales i recursos
- Permisos del PAS
Reboot del servidor sites (cPanel)
12/06/2020
El proper dimecres 6 de juliol a les 08:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:
- Pàgines personals
- Zones web de recerca i docència
- Tots els serveis associats al cPanel
Salut i dispenseu les molèsties,
Serveis TIC
Nou servidor de SAMBA
12/06/2020
El dilluns 4 de juliol es procedeix a actualitzar el servidor de samba. La nova versió és la 3.4.7 i s'executarà en un servidor totalment renovat.
El canvi es realitzarà entre les 8:00 i les 9:00 i en principi serà totalment transparent i no s'hauria de notar cap tall en el servei.
És convenient recordar, que tots els usuaris s'han de connectar a samba indicant que el servidor és: smbserver.ac.upc.es. Si teniu posat un altre nom o una IP, fora convenient canviar-lo per evitar errors una vegada s'aturi el servidor antic.
Condicionament acústic i de seguretat de la nevera del D6
12/06/2020
La setmana passada es van realitzar treballs de condicionament acústic i de
seguretat a la sala de servidors de l'edifici D6.
Les millores incloen noves portes més aïllants, robustes i segures i la
instal·lació de nous vidres, sense retirar els que ja hi han col·locats.
En aquestes fotos s'aprecien les novetats:
Ampliació de l'autonomia del nou sai del D6
12/06/2020
Avui s'ha realitzat una ampliació al SAI nou de l'edifici D6 per tal de doblar la seva autonomia (a igual càrrega de treball).
El resultat és un nou armari que, tot i ser més petit que l'anterior, conté les mateixes bateries, tal i com s'aprecia en aquesta imatge:
Nou servidor d'impressió
12/06/2020
S'ha actualitzat el servidor d'impressió, passant de la versió cups-1.3.4 a cups-1.4.3. Podeu veure els detalls dels canvis que implica aquesta versió al site oficial de CUPS:
http://www.cups.org/documentation.php/doc-1.4/whatsnew.html
També s'ha canviat de màquina a la que s'executava, executant-se ara en una màquina exclusiva de serveis on no tenen accés els usuaris, de forma que s'evita que problemes d'una execució d'un usuari afectin a un servei del departament.
Actualització: El servidor antic estarà actiu encara fins el dilluns 3/7/2011 per si algun usuari feia servir la IP o nom de l'antic serivdor, enlloc del nom genèric: printserver.ac.upc.es
reboot del servidor ribot1 (ftp, code i webmail)
12/06/2020
Demà dijous 16 de juny a les 08:00, procedirem a realitzar el reboot del servidor ribot1 per tal de poder ampliar el disc on estan hostatjats els projectes del servei code. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:
- FTP
- Webmail (Horde/IMP)
- Code: Hostatgeria de projectes (Trac/SVN/Hg/Git)
Actualització [08:10]: disc ampliat, ampliant filesystem...
Actualització [08:16]: filesystem ampliat, serveis disponibles, acaba l'actuació.
Parada d'Usuari Únic
12/06/2020
El proper dimarts 14/6/2011, de 8:00 a 9:30, es produirà una aturada de l'aplicatiu d'Usuari Únic, per tal
d'efectuar un canvi de servidor.
Aquesta aturada afectarà a l'aplicatiu web així com a totes les aplicacions/serveis que en depenen, com per
exemple signatura electrònica, quies, etc.
Reboot del servidor ribot4 (webera.e)
12/06/2020
Per tal de completar l'actualització de diversos paquets del sistema al servidor ribot6 (webera.e) el proper dijous procedirem a realitzar un reboot a les 08:00. L'aturada no hauria de durar més de 15 minuts.
Les zones web afectades són les següents:
- arco
- cpd
- dmag
- dsg
- jcsd2010
- pan-vg
- seecs
- wikiapc
Els responsables de les zones web han estats notificats per correu de l'actuació.
Actualització [08:10]: el reboot s'ha efectuat correctament i tots els serveis tornen a funcionar.
Actualització del servidor Robert
12/06/2020
El servidor de WinCenter de nom "Robert" feia alguns dies que anava molt lent. Avui, després d'alguns problemes, s'ha actualitzat el sistema i alguns programes i s'ha reiniciat, cosa que ha ajudat a rebaixar la càrrega de treball i a alliberar memòria correctament. Ara el servidor funciona més fluïd. Hem reiniciat el servidor cap a les 15:30 hores i ha trigat uns minuts en tornar a estar operatiu. Tots els usuaris que restaven connectats han estat avisats i han pogut tancar la sessió corresponent.
Manteniment a la sala del SAI del D6
12/06/2020
El proper dia 25 de maig a les 15h tindrà lloc una actuació de manteniment a la sala del SAI del D6. Es desplaçaran uns quadres elèctrics i també un component del deshumidificador de la sala per a fer espai per al mòdul d'ampliació de bateries del nou SAI, el qual s'instal·larà properament.
L'actuació no comporta tall del subministrament elèctric, per la qual cosa el no hi haurà interrupció del servei. L'actuació finalitzarà a les 17h.
Reboot del servidor sites (cPanel)
12/06/2020
Demà dimecres 4 de maig a les 08:00, procedirem a realitzar un reboot del servidor sites per tal de completar l'actualització d'alguns paquets bàsics del sistema. L'aturada durarà aproximadament 15 minuts i els serveis afectats seran els següents:
- Pàgines personals
- Zones web de recerca i docència
- Tots els serveis associats al cPanel
Salut i dispenseu les molèsties,
Serveis TIC
Actualització [4 maig 08:05]: el reboot s'ha completat correctament.
Reorganització dels rangs d'IPs externes
12/06/2020
Aprofitant l'aturada programada d'ahir, vam completar el procés de reorganització dels rangs d'adreces IP de la xarxa externa (fora del firewall departamental). El resultat final és que el nombre d'adreces IP dinàmiques s'ha vist incrementat notablement.
Confiem en què, a partir d'ara, sigui força més difícil arribar al límit de IPs dinàmiques concedides en un moment determinat, com ha succeït en algunes ocasions recentment.
Us recordem que la configuració de xarxa recomanada per als vostres equips és que useu assignació automàtica d'adreça IP mitjançant DHCP, independentment de què tingueu assignada una IP fixa o no; el servidor ja s'encarregarà d'atorgar-vos la vostra adreça reservada, si s'escau. Us recordem també la necessitat d'enregistrar convenientment els vostres equips a la xarxa.
Interrupción del suministro eléctrico en el D6 (20 de Abril)
12/06/2020
Hace unos meses mantenimiento de Campus detectó una avería en la acometida eléctrica del edificio D6. En concreto,el cable neutro estaba dañado.
El miércoles día 20 de Abril se realizará la reparación de esta avería, por lo cual durante unas horas el edificio no dispondrá de suministro eléctrico. Esto afectará a todos los servicios TIC del DAC (incluído red del C6).
Aprovecharemos la parada para realizar una pequeña mejora en la instalación eléctrica del CPD del D6. Esta mejora permitirá que el rack donde están instaladas las máquinas de servicios puedan alimentarse de los dos SAIs simultáneamente.
Actualitzación: La actuación eléctrica se realizará entre las 10:00 y las 13:00 por lo que el horario de actuaciones será el siguiente:
- 8:00: Inicio parada de servidores y comunicaciones
- 10:00: Inicio de la reparación
- 13:00: Finalización de la reparación (conexión de la electricidad en el edificio)
- 13:00: Inicio pequeña instalación en CPD
- 13:01: Inicio puesta en marcha de los servidores y comunicaciones
- 15:00: Todos los servicios disponibles
Documentación de los Servicios TIC
12/06/2020
Desde el viernes (18 de marzo) está disponible la nueva versión de la documentación de los Servicios TIC del DAC. Los cambios más destacados son:
- El web principal se encuentra el la red externa de forma que es más fácilmente accesible
- Utilizamos la misma plantilla que el Web del DAC por lo que ahora tiene el mismo aspecto corporativo
- El blog tiene RSS y al estar en la red externa puede leerse con cualquier lector
- Modificación de algunas páginas para mejorar la usabilidad
Afegint nodes al cluster salvat
12/06/2020
Comparteix: