news.shamcode.ru | Пилотный выпуск видео курса «Параллельное Программирование и Оптимизация для Intel Xeon Phi копроцес

Список тем трейнинга (на английском)

Welcome
- About This Document
- Disclaimer
- Introduction to the Intel Many Integrated Core (MIC) Architecture
- Purpose of the Intel MIC Architecture
- Details of the MIC Architecture
- Software Tools for Intel Xeon Phi Coprocessors
- Will My Application Benefit from the MIC architecture?
- Models for Intel Xeon Phi Coprocessor Programming
Overview of Programming Options
- Native Coprocessor Applications
- Explicit Offload
- Data and Memory Buffer Retention
- Virtual-Shared Memory Offload Model
- Handling Multiple Coprocessors
- Heterogeneous Programming with Coprocessors using MPI
- File I/O in MPI Applications on Coprocessors
Expressing Parallelism on Intel Architectures
- SIMD Parallelism and Automatic Vectorization
- Thread Parallelism and OpenMP
- Thread Synchronization in OpenMP
- Reduction Across Threads: Avoiding Synchronization
- Distributed Memory Parallelism and MPI
- Summary and Additional Resources
Optimization Using Intel Software Development Tools
- Optimization Roadmap
- Library Solution: Intel Math Kernel Library (MKL)
- Node-Level Tuning with Intel VTune Amplifier XE
- Cluster-Level Tuning with Intel Trace Analyzer and collector
Optimization of Scalar Arithmetics
- Compiler-friendly Practices
- Accuracy Control
- Optimization of Vectorization
- Diagnostics and Facilitation of Automatic Vectorization
- Vector-friendly Data Structures
- Data Alignment for Vectorization
- Strip-Mining for Vectorization
- Additional Vectorization ``Tuning Knobs''
Optimization of Thread Parallelism
- Reduction instead of Synchronization
- Elimination of False Sharing
- Expanding Iteration Space
- Controlling Thread Affinity
Optimization of Data Traffic
- Memory Access and Cache Utilization
- PCIe Traffic Optimization in Offload Applications
- MPI Traffic Optimization: Fabric Selection
Optimization of MPI Applications
- Load Balancing in Heterogeneous Applications
- Inter-Operation with OpenMP
- Additional Resources
Course Recap
- Knights Landing, the Next Manycore Architecture
- Where to Get More Information
- How to Obtain an Intel Xeon Phi Coprocessor

Названия лабораторных (на английском)

2.1-native
2.2-explicit-offload
2.3-explicit-offload-persistence
2.4-explicit-offload-matrix
2.5-sharing-complex-objects
2.6-multiple-coprocessors
2.7-asynchronous-offload
2.8-MPI
2.9-openmp4.0
3.1-vectorization
3.2-OpenMP
3.3-Cilk-Plus
3.4-MPI
4.1-vtune
4.2-itac
4.3-serial-optimization
4.4-vectorization-data-structure
4.5-vectorization-compiler-hints
4.6-optimize-shared-mutexes
4.7-optimize-scheduling
4.8-insufficient-parallelism
4.9-affinity
4.a-tiling
4.b-Nbody
4.c-cache-oblivious-recursion
4.d-cache-loop-fusion
4.e-offload
4.f-MPI-load-balance
4.g-hybrid
4.h-MKL

	Видео курс о параллельном программировании и оптимизации поможет мне в моей работе.
	Для меня проще смотреть видео, чем читать текст.
	Примеры изменения реального кода в видео лекции — ценное дополнение к учебному материалу.
	Тема пилотного эпизода была проста для понимания.
	Представленная информация достаточно детальна для понимания.
	Я вижу необходимость субтитров для этого и последующих видео классов.

	Обзор Intel Many Integrated Core (MIC) архитектуры.
	Анализ разницы между multi- и many-core архитектурами.
	Модели программирования для копроцессоров.
	Использование векторизации в коде.
	Использование многопоточности с помощью библиотеки OpenMP.
	Использование многопоточности с помощью расширения языка Cilk Plus.
	Использование распределённого параллелизма на основе MPI API.
	Скалярная оптимизация вычислений.
	Оптимизация векторизации и параллелизм данных.
	Оптимизация многопоточности.
	Оптимизация использования памяти и иерархии cache'а.
	Оптимизация передачи данных.
	Оптимизация MPI приложений для гетерогенных (CPU+coprocessors) кластеров.
	Использование Intel компиляторов.
	Профайлинг в Intel VTune Amplifier
	Сбор и визуализация MPI траффика в Intel Trace Analyzer and Collector (ITAC).
	Использование математической библиотеки Intel Math Kernel Library (MKL).
	Портирование приложений на копроцессор.
	Другая тема (укажите в комментариях).

	Да, очень интересно!
	Посмотрел бы некоторые темы.
	Совсем не интересно.