Материалы по тегу: рекорд

01.09.2017 [22:39], Алексей Степин

В обучении нейросетей достигнута производительность 15 петафлопс

Разработчики нейросетей и систем машинного обучения продолжают работы по усовершенствованию и ускорению соответствующих задач. Смешанная группа инженеров и учёных из Национальной лаборатории имени Лоуренса в Беркли, Стэнфордского университета и корпорации Intel впервые преодолела барьер 10 петафлопс при выполнении двух различных программ глубинного машинного обучения. Одна из них смогла показать рекордный результат — 15 петафлопс. Исследование проводилось с использованием суперкомпьютера Cori, установленного в министерстве энергетики США. Результаты эксперимента были опубликованы 17 августа и ознакомиться с ними можно по этой ссылке. В процессе вычислений использовалась математика одинарной точности — режима FP32 обычно достаточно с точки зрения достигаемой точности вычислений при обучении нейронных сетей. Иногда используются даже менее точные вычисления, такие, как FP16 или даже INT8.

Машинный зал Cori

Машинный зал Cori

В системе Cori, которая представляет собой Cray XC40, проблем с такой математикой нет: она состоит из 9688 процессоров Intel Xeon Phi 7250 серии Knights Landing. Пиковая производительность комплекса в режиме одинарной точности достигает 59 петафлопс, но из-за активного использования векторных инструкций (AVX), применяемых в матричной математике, тактовые частоты процессоров снизились с 1,4 до 1,2 ГГц, что понизило пиковую производительность до 50,6 петафлопс. Для тестовой задачи были использованы метеорологические данные общим объемом 15 Тбайт, полученные с помощью климатического симулятора. Именно при обработке этих моделей была достигнута пиковая производительность 15,07 петафлопс при устоявшейся 13,27 петафлопс. Задействовалось 9622 ядер Cori из 9688 физически имеющихся в системе. Показатели масштабируемости тоже впечатляют: 7205-кратное увеличение скорости вычислений было получено при переходе от 1 процессорного ядра к 9622. Второй тестовой задачей был обсчёт набора данных из области физики высоких энергий. Здесь скорости составили 11,73 и 11,41 петафлопс, соответственно, а масштабируемость достигла показателя 6173.

Некоторые полученные данные о масштабируемости задач

Некоторые полученные данные о масштабируемости задач

К сожалению, в тестовых задачах каждый из Xeon Phi смог выдать около 2 терафлопс из 6 возможных, но это практически предел для реальных приложений — как традиционных задач класса HPC, так и задач машинного обучения. Что касается точности, то итоговые показатели оказались неплохими: в задаче из области физики высоких энергий точность корректного распознавания сигналов составила 72 %, что существенно выше, нежели при применении традиционного анализа, при котором достигается точность порядка 42 %. К сожалению, численная оценка точности климатической задачи не производилась, но исследователи утверждают, что нейронная сеть отлично справилась с поиском, локализацией и идентификацией тропических циклонов, что было её главной целью. Исследователи намерены продолжать работы: планируется как оптимизация имеющихся алгоритмов машинного обучения, так и внедрение новых. В планах есть и применение систем с более низкой точностью обработки данных, поскольку это может позволить добиться ускорения процесса обучения нейросетей.

Постоянный URL: http://servernews.ru/957957
26.04.2016 [13:08], Сергей Карасёв

США планируют создать экзафлопсный суперкомпьютер к 2023 году

Соединённые Штаты ведут разработку сверхмощной вычислительной системы, производительность которой должна будет превысить отметку в 1 экзафлопс, или 1000 петафлопс.

Согласно нынешней редакции рейтинга Тор-500, самым быстрым суперкомпьютером в мире является созданная в КНР система Tianhe-2. Этот комплекс, смонтированный в Национальном суперкомпьютерном центре в Гуанчжоу, обладает быстродействием в 33,86 петафлопса (квадриллионов операций с плавающей запятой в секунду). Пиковая производительность составляет 54,9 петафлопса.

Самым же мощным суперкомпьютером США является система Titan, установленная в Оукриджской национальной лаборатории Министерства энергетики США. Этот комплекс показывает быстродействие в 17,59 петафлопса, а пиковая производительность достигает 27,11 петафлопса.

Проектируемый экзафлопсный суперкомпьютер будет содержать сотни миллионов вычислительных ядер. Он сможет выполнять более квинтильона операций с плавающей запятой в секунду.

Столь мощная система потребует от 20 до 30 МВт энергии, что сравнимо с ресурсами небольшой электростанции. Для размещения стоек с оборудованием потребуется огромная площадь.

В текущем году на создание экзафлопсного суперкомпьютера власти США выделят около $300 млн. Несколько большая сумма будет предоставлена в 2017-м. Общие же затраты на разработку комплекса составят около $3 млрд. Ввести его в строй планируется к 2023 году. 

Постоянный URL: http://servernews.ru/932035
26.09.2012 [08:03], Георгий Орлов

Франкфуртская точка обмена интернет-трафиком DE-CIX зафиксировала рекорд - 2 Тбита/с

Компания DE-CIX Management GmbH сообщила о зафиксированном ее специалистами рекордном объеме трафика, обработанного франкфуртской точкой обмена интернет-трафиком DE-CIX, - 2 Тбит/с. Объем трафика, ежедневно проходящего через узел DE-CIX, к которому на данный момент подключены более 480 интернет-провайдеров из более чем 50 стран, превышает 12 Пбайт, что соответствует объему 2,7 млн дисков DVD. По словам представителей DE-CIX, наиболее быстрыми темпами растет трафик телевидения высокого разрешения (HD-TV), мультимедийных площадок, игровых онлайн-сервисов и облачных платформ. Генеральный директор DE-CIX Management GmbH Гаральд Самма (Harald Summa) сообщил, что, по оценкам специалистов компании, ежегодный рост обрабатываемого DE-CIX трафика составит в будущем примерно 80%.

DE-CIX

Имеющий топологию "звезда" узел DE-CIX подключен к 12 дата-центрам разных операторов, расположенных в окрестностях Франкфурта. В центре "звезды" находятся два дополняющих друг друга кластера базовых коммутаторов, один из которых активен, а другой находится в резерве и может быть подключен в любой момент. Основные кластеры имеют параллельное подсоединение к 14 периферийным кластерам коммутаторов, к которым и подключаются провайдерские сети. Технический директор компании Арнольд Ниппер (Arnold Nipper) сообщил, что пропускная способность инфраструктуры DE-CIX может быть доведена до 40 Тбит/с. Точка DE-CIX во Франкфурте заработала в 1995 году и является сейчас основным узлом обмена трафиком для провайдеров Центральной и Восточной Европы.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/596598
21.04.2011 [15:49], SN Team

Cisco устанавила 9 мировых рекордов с процессорами Intel Xeon E7

Новейшие многоядерные серверные процессоры Intel Xeon E7 только увидели свет, как Cisco объявляет о выпуску нового стоечного сервера UCS (Unified Computing System). В M2 UCS C260 можно установить два процессора Inel Xeon E7-2800, до одного терабайта оперативной памяти и организовать локальное хранилище объемом до 9,6 Тбайт.

 

 

Cisco также предлагает и другие модели серверов с новыми процессорами, B230 M2, B440 M2, и C460 M2, которые обеспечат повышенную производительность виртуальных сред. Компания будет выпускать свои решения UCS в 9 различных форм-факторах, включая традиционные стоечные и блейд-серверы.

С выпуском Xeon E7, Cisco удалось покорить 9 мировых рекордов в различных тестах производительности, включая популярные бенчмарки VMware VMmark, TPPC (Transaction Processing Performance Council) и SPEC (Standard Performance Evaluation Corporation). «Рекордсменом» стал сервер UCS C460 M2 с программным обеспечением VMware ESX 4.1, набравший 16,68 баллов в приложении VMmark 2.0. Еще 8 наград Cisco завоевала в тестах SPEC.

Кроме Cisco с 9 рекордами, Intel Xeon E7 принесли победу Hewlett-Packard в 5 дисциплинах, SGI лидирует в 4 номинациях, серверы компаний IBM, Dell, Oracle и Fujitsu смогли покорить только по одному тесту.

Источник:

Постоянный URL: http://servernews.ru/594509
11.10.2010 [18:18], Константин Ходаковский

Сервер Fujitsu PRIMERGY RX900 S1 установил мировой рекорд

Два сервера компании Fujitsu были включены организацией Transaction Processing Performance Council (TPC) в первую десятку по результатам эталонного тестирования TPC-E. При этом сервер PRIMERGY RX900 S1 показал наивысший результат, а PRIMERGY RX600 S5 занял третье место в своих категориях. Результаты тестов показывают также отличные показатели по соотношению цены и производительности:

  • PRIMERGY RX900 S1 с 8 процессорами Intel Xeon X7560 и объёмом памяти 1 Тбайт выдала следующий результат: 3800,00 транзакций в секунду (tpsE) и $245,82 на одну транзакцию.
  • PRIMERGY RX600 S5 с 4 процессорами Intel Xeon X7560 и объёмом памяти 512 Гбайт выдала следующий результат: 2046,96 транзакции в секунду (tpsE) и $193,68 на одну транзакцию.

 

PRIMERGY RX900 S1

 

Выпущенная недавно система PRIMERGY RX900 S11 представляет собой 8-процессорный стоечный сервер с высокой степенью масштабируемости без необходимости изменения инфраструктуры стойки.

 

PRIMERGY RX600 S5

 

Недорогой сервер PRIMERGY RX600 S52 является отличной четырехпроцессорной системой и предназначается для предприятий среднего бизнеса и для крупных компаний. Это решение с большим объёмом памяти хорошо подходит для работы группы виртуальных машин, серверных приложений вроде СУБДб системы электронной коммерции и т. д.

 

PRIMERGY RX900 S1

PRIMERGY RX900 S1

 

Йенс-Петер Зайк (Jens-Peter Seick), старший вице-президент Fujitsu Technology Solutions, директор подразделения систем для центров обработки данных, отмечает: «Чтобы уменьшить эксплуатационные расходы, компании консолидируют устаревшие двух- и четырехпроцессорные серверы, а также отказываются от эксплуатации UNIX-серверов, чтобы воспользоваться гибкими системами, разработанными на базе отраслевых стандартов, которые имеют более привлекательное соотношение цены и производительности. Эталонный тест TCP-E предназначен для заказчиков, выбирающих систему, отвечающую их потребностям. Этот независимый источник подтверждает, что серверы Fujitsu имеют не только высочайшую производительность, но и отличное соотношение «цена/производительность».

Источник:

Постоянный URL: http://servernews.ru/593673
15.07.2010 [12:41], Константин Ходаковский

Сервер IBM x3690 X5 установил рекорд в тесте SPEC

Как сообщает компания IBM, её сервер System x3690 X5, анонсированный в марте этого года, достиг результата в 1 015 260 операций в секунду в эталонном тесте SPECjbb 2005, используемом для оценки производительности серверов в типовых задачах Java. Это наивысший результат, когда-либо полученный 2-сокетным x86-сервером.

Логотип IBM

Конфигурация сервера включала:

  • два 8-ядерных 16-потоковых процессора Intel Xeon X7560 с частотой 2,26 ГГц и 24 Мб кеш-памяти 3 уровня на каждый CPU;
  • 128 Гб оперативной памяти, дисковое пространство на 73 Гб;
  • ОС Microsoft Windows Server 2008 R2 Enterprise x64 и программное обеспечение IBM J9 Java 6, использующее 1875 Мб динамически распределяемой оперативной памяти.
Intel Xeon 7500

Таким образом, сервер x3690 X5 предоставляет наилучшую производительность для предприятий, использующих рабочие нагрузки на базе Java. Конкурирующие 2-сокетные системы Westmere EP поддерживают до 15 модулей памяти DIMM, при этом сервер IBM System x3690 X5 позволяет установить до 64 планок DIMM, без необходимости использования дополнительного процессора. Но по мере роста нужд сервер может масштабироваться и до 4-сокетной конфигурации.

При этом система x3690 X5 с 32-мя модулями памяти DIMM сможет поддерживать выполнение 320 виртуальных машин. За половину стоимости ПО система будет поддерживать за счет объема памяти такое же количество виртуальных машин, что и конкурирующие решения.

 

IBM System x3690 X5

Благодаря технологии хранения данных IBM eXFlash, сервер System x3690 X5 предлагает самую большую в отрасли емкость хранения данных на SSD и самый высокий показатель скорости операций ввода/вывода в секунду (IOPS). Поэтому клиентам не нужно приобретать дополнительные внешние системы хранения для поддержки своих баз данных. Всего с одним массивом eXFlash SSD клиенты получают такую же производительность, как у 800 жестких дисков. Сервер поддерживает до трёх массивов eXFlash (всего до 4,8 Тб и 480 000 IOPS). eXFlash — это главное и наиболее существенное отличие x3690 X5, позволяющее в десятки раз сократить затраты на системы хранения данных.

Начало мировых поставок IBM System x3690 X5 на базе процессора Intel Xeon X7560 начнётся 23 августа 2010 года.

Постоянный URL: http://servernews.ru/593577
Система Orphus