Implement flock-based bitmap GPU allocator for CI parallelization #333

Workflow file for this run

.github/workflows/iris-tests.yml at 27d98b3

	name: Iris Tests

	on:
	push:
	branches: [ main ]
	pull_request:
	branches: [ main ]
	workflow_dispatch:

	concurrency:
	group: ${{ github.workflow }}-${{ github.head_ref \|\| github.ref }}
	cancel-in-progress: ${{ github.ref != 'refs/heads/main' }}

	env:
	DOCKER_IMAGE_NAME: ${{ vars.DOCKER_IMAGE_NAME \|\| 'iris-dev-triton-aafec41' }}

	jobs:
	build-container-image:
	runs-on: [self-hosted, mi3xx]

	steps:
	- name: Checkout repository
	uses: actions/checkout@v4

	- name: Setup Apptainer (if not available)
	run: \|
	if ! command -v apptainer &> /dev/null && ! command -v docker &> /dev/null; then
	echo "Neither Apptainer nor Docker found, installing Apptainer..."
	apt-get update && apt-get install -y software-properties-common
	add-apt-repository -y ppa:apptainer/ppa
	apt-get update && apt-get install -y apptainer
	else
	echo "Container runtime already available"
	fi

	- name: Build Iris container
	run: \|
	bash .github/scripts/container_build.sh

	test-git:
	name: Test ${{ matrix.test_dir }} (${{ matrix.num_ranks }} ranks, git install)
	needs: build-container-image
	runs-on: [self-hosted, mi3xx]
	strategy:
	fail-fast: false
	matrix:
	include:
	# Test each subdirectory with each rank count using git install
	- test_dir: examples
	num_ranks: 1
	- test_dir: examples
	num_ranks: 2
	- test_dir: examples
	num_ranks: 4
	- test_dir: examples
	num_ranks: 8
	- test_dir: unittests
	num_ranks: 1
	- test_dir: unittests
	num_ranks: 2
	- test_dir: unittests
	num_ranks: 4
	- test_dir: unittests
	num_ranks: 8
	- test_dir: ccl
	num_ranks: 1
	- test_dir: ccl
	num_ranks: 2
	- test_dir: ccl
	num_ranks: 4
	- test_dir: ccl
	num_ranks: 8
	- test_dir: x
	num_ranks: 1
	- test_dir: x
	num_ranks: 2
	- test_dir: x
	num_ranks: 4
	- test_dir: x
	num_ranks: 8
	- test_dir: ops
	num_ranks: 1
	- test_dir: ops
	num_ranks: 2
	- test_dir: ops
	num_ranks: 4
	- test_dir: ops
	num_ranks: 8

	steps:
	- name: Checkout repository
	uses: actions/checkout@v4

	- name: Cleanup lingering ports before tests
	run: \|
	bash .github/scripts/cleanup_ports.sh

	- name: Run ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (git install)
	env:
	GITHUB_REPOSITORY: ${{ github.repository }}
	GITHUB_SHA: ${{ github.sha }}
	run: \|
	set -e
	echo "::group::Running ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (install: git)"
	bash .github/scripts/run_tests.sh \
	"${{ matrix.test_dir }}" \
	"${{ matrix.num_ranks }}" \
	"" \
	"git"
	echo "::endgroup::"
	echo "✅ ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (git) passed!"

	test-editable:
	name: Test ${{ matrix.test_dir }} (${{ matrix.num_ranks }} ranks, editable install)
	needs: [build-container-image, test-git]
	runs-on: [self-hosted, mi3xx]
	strategy:
	fail-fast: false
	matrix:
	include:
	# Test each subdirectory with each rank count using editable install
	- test_dir: examples
	num_ranks: 1
	- test_dir: examples
	num_ranks: 2
	- test_dir: examples
	num_ranks: 4
	- test_dir: examples
	num_ranks: 8
	- test_dir: unittests
	num_ranks: 1
	- test_dir: unittests
	num_ranks: 2
	- test_dir: unittests
	num_ranks: 4
	- test_dir: unittests
	num_ranks: 8
	- test_dir: ccl
	num_ranks: 1
	- test_dir: ccl
	num_ranks: 2
	- test_dir: ccl
	num_ranks: 4
	- test_dir: ccl
	num_ranks: 8
	- test_dir: x
	num_ranks: 1
	- test_dir: x
	num_ranks: 2
	- test_dir: x
	num_ranks: 4
	- test_dir: x
	num_ranks: 8
	- test_dir: ops
	num_ranks: 1
	- test_dir: ops
	num_ranks: 2
	- test_dir: ops
	num_ranks: 4
	- test_dir: ops
	num_ranks: 8

	steps:
	- name: Checkout repository
	uses: actions/checkout@v4

	- name: Cleanup lingering ports before tests
	run: \|
	bash .github/scripts/cleanup_ports.sh

	- name: Run ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (editable install)
	run: \|
	set -e
	echo "::group::Running ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (install: editable)"
	bash .github/scripts/run_tests.sh \
	"${{ matrix.test_dir }}" \
	"${{ matrix.num_ranks }}" \
	"" \
	"editable"
	echo "::endgroup::"
	echo "✅ ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (editable) passed!"

	test-install:
	name: Test ${{ matrix.test_dir }} (${{ matrix.num_ranks }} ranks, pip install)
	needs: [build-container-image, test-editable]
	runs-on: [self-hosted, mi3xx]
	strategy:
	fail-fast: false
	matrix:
	include:
	# Test each subdirectory with each rank count using pip install
	- test_dir: examples
	num_ranks: 1
	- test_dir: examples
	num_ranks: 2
	- test_dir: examples
	num_ranks: 4
	- test_dir: examples
	num_ranks: 8
	- test_dir: unittests
	num_ranks: 1
	- test_dir: unittests
	num_ranks: 2
	- test_dir: unittests
	num_ranks: 4
	- test_dir: unittests
	num_ranks: 8
	- test_dir: ccl
	num_ranks: 1
	- test_dir: ccl
	num_ranks: 2
	- test_dir: ccl
	num_ranks: 4
	- test_dir: ccl
	num_ranks: 8
	- test_dir: x
	num_ranks: 1
	- test_dir: x
	num_ranks: 2
	- test_dir: x
	num_ranks: 4
	- test_dir: x
	num_ranks: 8
	- test_dir: ops
	num_ranks: 1
	- test_dir: ops
	num_ranks: 2
	- test_dir: ops
	num_ranks: 4
	- test_dir: ops
	num_ranks: 8

	steps:
	- name: Checkout repository
	uses: actions/checkout@v4

	- name: Cleanup lingering ports before tests
	run: \|
	bash .github/scripts/cleanup_ports.sh

	- name: Run ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (pip install)
	run: \|
	set -e
	echo "::group::Running ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (install: install)"
	bash .github/scripts/run_tests.sh \
	"${{ matrix.test_dir }}" \
	"${{ matrix.num_ranks }}" \
	"" \
	"install"
	echo "::endgroup::"
	echo "✅ ${{ matrix.test_dir }} tests with ${{ matrix.num_ranks }} ranks (install) passed!"

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Implement flock-based bitmap GPU allocator for CI parallelization #333

Workflow file

Implement flock-based bitmap GPU allocator for CI parallelization #333

Uh oh!

Workflow file for this run