Кластер PostgreSQL высокой надежности на базе Patroni, Haproxy, Keepalived

Автор: admin от 21-02-2017, 16:05, посмотрело: 18

Привет, Хабр!

Встала передо мной недавно задача: настроить максимально надежный кластер серверов PostgreSQL версии 9.6.

По задумке, хотелось получить кластер, который переживает выпадение любого сервера, или даже нескольких серверов, и умеет автоматически вводить в строй сервера после аварий.

Планируя кластер я проштудировал много статей, как из основной документации к PostgreSQL, так и различных howto, в том числе с Хабра, и пробовал настроить стандартный кластер с RepMgr, эксперементировал с pgpool.
В целом оно заработало, но у меня периодически всплывали проблемы с переключениями, требовалось ручное вмешательство для восстановления после аварий, и т.д.
В общем я решил поискать еще варианты.
В итоге где-то (уже не вспомню точно где) нашел ссылку на прекрасный проект Zalando Patroni, и все заверте…

Категория: Системное администрирование, Linux

 

Как поссорились разработка с эксплуатацией — и как помирились

Автор: admin от 21-02-2017, 13:00, посмотрело: 17

Как поссорились разработка с эксплуатацией — и как помирились


С чего начинается любой проект по ИТ-инфраструктуре? Если вы подумали о чем-то вроде: админы собрались, обсудили и кто-то предложил решение, — то с высокой вероятностью попали в точку. Именно так обстоят дела с эксплуатацией в российских компаниях, и у нас до недавнего времени тоже.


В статье расскажу о том, как мы потратили 5 миллионов и почти полгода на то, чтобы убедиться: отличных специалистов и энтузиазма недостаточно для внедрения чего-либо масштабного.

Категория: Компании » Яндекс

 

Состояние сетевой безопасности в 2016 году, подробный отчёт Qrator Labs и Wallarm

Автор: admin от 15-02-2017, 18:05, посмотрело: 21

Состояние сетевой безопасности в 2016 году, подробный отчёт Qrator Labs и Wallarm

«Хабраэффект» наоборот — атаки на Хабрахабр за год (сверху) и на Гиктаймс (снизу). В феврале 2017 на Гиктаймс была нейтрализована атака в 17,5 Гбит/с.

Состояние сетевой безопасности в 2016 году, подробный отчёт Qrator Labs и Wallarm

Как компания, чьей основной деятельность является нейтрализации DDoS, в прошлом году мы наблюдали несколько изменений в отрасли.

Инциденты, связанные с атаками типа «отказ в обслуживании» вновь на слуху — но теперь грамотно выполненные атаки уже угрожают доступности целых регионов. На проблему вновь нужно обращать повышенное внимание — словно мы вернулись на 5—7 лет назад в прошлое.

До прошлого года могло показаться, что проблема DDoS уже достаточно хорошо решена.

Но мощность атак и их сложность в минувшем году выросли радикально. В прошлом даже мощные атаки в 100—300 Гбит/с не вызывали особой «головной боли». Сложные типы атак на протоколы прикладного уровня случались редко. А в 2016 году мир впервые увидел атаки в 1 Тбит/с, и атаки на уровень L7 стали куда более распространёнными.

Категория: Админитстрирование » Сетевые технологии

 

Automount afuse

Автор: admin от 11-02-2017, 21:40, посмотрело: 101

Я хотел рассказать про своё открытие afuse — автомонтирование файловых систем по требованию, автоматически.

Разве не здорово просто сделать:
ls /mnt/remote/web.example.com/var/lib/www/

и сразу увидеть файлы web-сервера, никак не устанавливая с ним соединение специально?

Я этим пользуюсь уже давно, а главное:

  • Это работает из любого источника: Не важно, делаете вы указанный вывод в консоли, сохранили ссылку в MC или переходите из favorites вашего любимого менеджера такого как nautilus или dolphin

  • Вы можете переходить на любой хост, куда у вас есть доступ по ключам (настроить запрос пароля тоже можно, но это не интересно)

  • Вы можете запросто указать под каким пользователем входить на сервер, традиционно используя @:
    cd /mnt/remote/apache@web.example.com/var/lib/www/
    



Категория: Системное администрирование, Linux

 

SmartMonitoring — мониторинг бизнес-логики в Одноклассниках

Автор: admin от 9-02-2017, 11:15, посмотрело: 25

SmartMonitoring — мониторинг бизнес-логики в Одноклассниках


Сейчас у нас в Одноклассниках есть четыре географически распределённых дата-центра, 11 тыс. серверов, более 1 тыс. сетевых устройств, 180 сервисов. Под сервисами мы понимаем фото, видео, музыку, ленту и т. д. Ежедневно сайт посещают десятки миллионов уникальных пользователей. И за всем этим хозяйством необходимо следить, чем и занимаются:


  • команда инженеров, которая устанавливает оборудование, меняет диски, решает hardware-инциденты;

  • команда мониторинга, которая как раз ищет эти инциденты и отдаёт в работу другим командам;

  • сетевые администраторы, они работают с сетью, настраивают оборудование;

  • системные администраторы, они администрируют и настраивают портал;

  • разработчики.


Мы сами устанавливаем и настраиваем наши серверы, но так как их очень много, то неизбежно, что каждый день что-то ломается. И наша самая главная задача в таком случае — увидеть поломку быстрее пользователей. Поэтому за работу всего портала отвечает целая команда мониторинга. Они просматривают графики, ищут в них аномалии, заводят инциденты, распределяют «автоинциденты», которые создаются при помощи связки Zabbix + JIRA. Мы не просто мониторим бизнес-логику, но и автоматически её анализируем. Подробнее об этом я и расскажу далее.

Категория: Админитстрирование » Системное администрирование

 

Использование GlusterFS с кластером Docker swarm

Автор: admin от 7-02-2017, 17:35, посмотрело: 24

Использование GlusterFS с кластером Docker swarm

В этой статье я описал создание в AWS состоящего из трех нод кластера Docker Swarm и подключение к нему общего для всех нод реплицируемого тома GlusterFS.

Категория: Системное администрирование, Linux

 

Powershell и русские символы в консольных приложениях

Автор: admin от 4-02-2017, 03:05, посмотрело: 49

В процессе разработки очень часто возникает необходимость запустить из powershell скрипта консольное приложение. Что может быть проще?
#test.ps1
& $PSScriptRootConsoleApp.exe

Powershell и русские символы в консольных приложениях

Категория: Админитстрирование » Системное администрирование

 

Обзор архитектуры и подсистем деплоя и мониторинга. Как инженеры делают систему прозрачной для разработки

Автор: admin от 2-02-2017, 09:45, посмотрело: 37

Обзор архитектуры и подсистем деплоя и мониторинга. Как инженеры делают систему прозрачной для разработки

Константин Никифоров ( melazyk )


Доклад будет про всякие секретные и не очень штуки, которые такая большая компания, как Mail.Ru, использует в мониторинге и для деплоя, и для управления конфигурацией.

Меня зовут Константин Никифоров, я являюсь руководителем группы системных администраторов в компании Mail.Ru. Наша группа занимается обслуживанием проектов target.my.com, рекламными системами Mail.Ru и проектом top.mail.ru. Все три наших проекта достаточно специфичные, потому что мы не обладаем никаким юзер контентом, мы в основном паразитируем на вас, как пользователях, и особенность наша заключается в том, что у нас очень большие PPS на фронтах, что не у многих проектов есть. Т.е. у таких проектов, как Одноклассники, как ВКонтакте, это понятно, потому что они просто огромные, у более мелких проектов такого нет. А мы размещаемся на всех вышеперечисленных и на всех страницах Mail.Ru, поэтому наш PPS еще больше, чем у этих проектов.

Категория: Админитстрирование » Системное администрирование

 

Gitlab «лежит», база уничтожена (восстанавливается)

Автор: admin от 1-02-2017, 16:45, посмотрело: 40

Gitlab «лежит», база уничтожена (восстанавливается)
Вчера, 31 января, сервис Gitlab случайно уничтожил свою продакшн базу данных (сами гит-репозитории не пострадали).

Дело было примерно так.

Категория: Админитстрирование » Системное администрирование

 

Как мы Redis Cluster готовили

Автор: admin от 31-01-2017, 17:20, посмотрело: 46

Как мы Redis Cluster готовили

В мире опен сорс есть огромное количество технологий, подходов, паттернов, тулзов и аппов, которые юзает очень много компаний. Как превратить используемое ПО или технологию в конкурентное преимущество? Предлагаю рассмотреть на примере Redis Cluster — как мы прокладывали наш путь.

Категория: Системное администрирование, Linux

 
Назад Вперед