import json
import os
import sys
from unittest.mock import MagicMock, call, patch

import pytest

from litellm.constants import DEFAULT_MAX_RECURSE_DEPTH

sys.path.insert(
    0, os.path.abspath("../../..")
)  # Adds the parent directory to the system path

import litellm
from litellm.llms.vertex_ai.vertex_ai_aws_wif import VertexAIAwsWifAuth
from litellm.llms.vertex_ai.vertex_llm_base import VertexBase


def run_sync(coro):
    """Helper to run coroutine synchronously for testing"""
    import asyncio

    return asyncio.run(coro)


class TestVertexBase:
    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_credential_project_validation(self, is_async):
        vertex_base = VertexBase()

        # Mock credentials with project_id "project-1"
        mock_creds = MagicMock()
        mock_creds.project_id = "project-1"
        mock_creds.token = "fake-token-1"
        mock_creds.expired = False
        mock_creds.quota_project_id = "project-1"

        # Test case 1: Ensure credentials match project
        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ):
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials={"type": "service_account", "project_id": "project-1"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials={"type": "service_account", "project_id": "project-1"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            assert project == "project-1"
            assert token == "fake-token-1"

        # Test case 2: Allow using credentials from different project
        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ):
            if is_async:
                result = await vertex_base._ensure_access_token_async(
                    credentials={"type": "service_account"},
                    project_id="different-project",
                    custom_llm_provider="vertex_ai",
                )
            else:
                result = vertex_base._ensure_access_token(
                    credentials={"type": "service_account"},
                    project_id="different-project",
                    custom_llm_provider="vertex_ai",
                )
            print(f"result: {result}")

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_cached_credentials(self, is_async):
        vertex_base = VertexBase()

        # Initial credentials
        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "project-1"
        mock_creds.quota_project_id = "project-1"

        # Test initial credential load and caching
        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ):
            # First call should load credentials
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            assert token == "token-1"

            # Second call should use cached credentials
            if is_async:
                token2, project2 = await vertex_base._ensure_access_token_async(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token2, project2 = vertex_base._ensure_access_token(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            assert token2 == "token-1"
            assert project2 == "project-1"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_credential_refresh(self, is_async):
        vertex_base = VertexBase()

        # Create expired credentials
        mock_creds = MagicMock()
        mock_creds.token = "my-token"
        mock_creds.expired = True
        mock_creds.project_id = "project-1"
        mock_creds.quota_project_id = "project-1"

        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ), patch.object(vertex_base, "refresh_auth") as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"
                creds.expired = False

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials={"type": "service_account"},
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )

            assert mock_refresh.called
            assert token == "refreshed-token"
            assert not mock_creds.expired

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_gemini_credentials(self, is_async):
        vertex_base = VertexBase()

        # Test that Gemini requests bypass credential checks
        if is_async:
            token, project = await vertex_base._ensure_access_token_async(
                credentials=None, project_id=None, custom_llm_provider="gemini"
            )
        else:
            token, project = vertex_base._ensure_access_token(
                credentials=None, project_id=None, custom_llm_provider="gemini"
            )
        assert token == ""
        assert project == ""

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_authorized_user_credentials(self, is_async):
        vertex_base = VertexBase()

        quota_project_id = "test-project"

        credentials = {
            "account": "",
            "client_id": "fake-client-id",
            "client_secret": "fake-secret",
            "quota_project_id": "test-project",
            "refresh_token": "fake-refresh-token",
            "type": "authorized_user",
            "universe_domain": "googleapis.com",
        }

        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.quota_project_id = quota_project_id

        with patch.object(
            vertex_base, "_credentials_from_authorized_user", return_value=mock_creds
        ) as mock_credentials_from_authorized_user, patch.object(
            vertex_base, "refresh_auth"
        ) as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"

            mock_refresh.side_effect = mock_refresh_impl

            # 1. Test that authorized_user-style credentials are correctly handled and uses quota_project_id
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            assert mock_credentials_from_authorized_user.called
            assert token == "refreshed-token"
            assert project == quota_project_id

            # 2. Test that authorized_user-style credentials are correctly handled and uses passed in project_id
            not_quota_project_id = "new-project"
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=not_quota_project_id,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=not_quota_project_id,
                    custom_llm_provider="vertex_ai",
                )

            assert token == "refreshed-token"
            assert project == not_quota_project_id

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_identity_pool_credentials(self, is_async):
        vertex_base = VertexBase()

        # Test case: Using Workload Identity Federation for Microsoft Azure and
        # OIDC identity providers (default behavior)
        credentials = {
            "project_id": "test-project",
            "refresh_token": "fake-refresh-token",
            "type": "external_account",
        }
        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "test-project"

        with patch.object(
            vertex_base, "_credentials_from_identity_pool", return_value=mock_creds
        ) as mock_credentials_from_identity_pool, patch.object(
            vertex_base, "refresh_auth"
        ) as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, _ = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, _ = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            assert mock_credentials_from_identity_pool.called
            assert mock_credentials_from_identity_pool.call_args[1]["scopes"] == [
                "https://www.googleapis.com/auth/cloud-platform"
            ]
            assert token == "refreshed-token"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_identity_pool_credentials_with_aws(self, is_async):
        vertex_base = VertexBase()

        # Test case: Using Workload Identity Federation for Microsoft Azure and
        # OIDC identity providers (default behavior)
        credentials = {
            "project_id": "test-project",
            "refresh_token": "fake-refresh-token",
            "type": "external_account",
            "credential_source": {"environment_id": "aws1"},
        }
        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "test-project"

        with patch.object(
            vertex_base,
            "_credentials_from_identity_pool_with_aws",
            return_value=mock_creds,
        ) as mock_credentials_from_identity_pool_with_aws, patch.object(
            vertex_base, "refresh_auth"
        ) as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, _ = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, _ = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            assert mock_credentials_from_identity_pool_with_aws.called
            assert mock_credentials_from_identity_pool_with_aws.call_args[1][
                "scopes"
            ] == ["https://www.googleapis.com/auth/cloud-platform"]
            assert token == "refreshed-token"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_new_cache_format_tuple_storage(self, is_async):
        """Test that new cache format stores (credentials, project_id) tuples"""
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "project-1"
        mock_creds.quota_project_id = "project-1"

        credentials = {"type": "service_account", "project_id": "project-1"}

        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ):
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )

            assert token == "token-1"
            assert project == "project-1"

            # Verify cache stores tuple format
            cache_key = (json.dumps(credentials), "project-1")
            assert cache_key in vertex_base._credentials_project_mapping
            cached_entry = vertex_base._credentials_project_mapping[cache_key]
            assert isinstance(cached_entry, tuple)
            assert len(cached_entry) == 2
            cached_creds, cached_project = cached_entry
            assert cached_creds == mock_creds
            assert cached_project == "project-1"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_backward_compatibility_old_cache_format(self, is_async):
        """Test backward compatibility with old cache format (just credentials)"""
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "project-1"
        mock_creds.quota_project_id = "project-1"

        credentials = {"type": "service_account", "project_id": "project-1"}

        # Simulate old cache format by manually adding just credentials (not tuple)
        cache_key = (json.dumps(credentials), "project-1")
        vertex_base._credentials_project_mapping[cache_key] = mock_creds

        # Should handle old format gracefully
        if is_async:
            token, project = await vertex_base._ensure_access_token_async(
                credentials=credentials,
                project_id="project-1",
                custom_llm_provider="vertex_ai",
            )
        else:
            token, project = vertex_base._ensure_access_token(
                credentials=credentials,
                project_id="project-1",
                custom_llm_provider="vertex_ai",
            )

        assert token == "token-1"
        assert project == "project-1"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_resolved_project_id_cache_optimization(self, is_async):
        """Test that resolved project_id creates additional cache entries for optimization"""
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "resolved-project"
        mock_creds.quota_project_id = "resolved-project"

        credentials = {"type": "service_account"}

        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "resolved-project")
        ):
            # Call without project_id, should use resolved project from credentials
            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            assert token == "token-1"
            assert project == "resolved-project"

            # Verify both cache entries exist
            original_cache_key = (json.dumps(credentials), None)
            resolved_cache_key = (json.dumps(credentials), "resolved-project")

            assert original_cache_key in vertex_base._credentials_project_mapping
            assert resolved_cache_key in vertex_base._credentials_project_mapping

            # Both should contain the same tuple
            original_entry = vertex_base._credentials_project_mapping[
                original_cache_key
            ]
            resolved_entry = vertex_base._credentials_project_mapping[
                resolved_cache_key
            ]

            assert isinstance(original_entry, tuple)
            assert isinstance(resolved_entry, tuple)
            assert original_entry[0] == mock_creds
            assert original_entry[1] == "resolved-project"
            assert resolved_entry[0] == mock_creds
            assert resolved_entry[1] == "resolved-project"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_cache_update_on_credential_refresh(self, is_async):
        """Test that cache is updated when credentials are refreshed"""
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "original-token"
        mock_creds.expired = True  # Start with expired credentials
        mock_creds.project_id = "project-1"
        mock_creds.quota_project_id = "project-1"

        credentials = {"type": "service_account", "project_id": "project-1"}

        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "project-1")
        ), patch.object(vertex_base, "refresh_auth") as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"
                creds.expired = False

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, project = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, project = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id="project-1",
                    custom_llm_provider="vertex_ai",
                )

            assert mock_refresh.called
            assert token == "refreshed-token"
            assert project == "project-1"

            # Verify cache was updated with refreshed credentials
            cache_key = (json.dumps(credentials), "project-1")
            assert cache_key in vertex_base._credentials_project_mapping
            cached_entry = vertex_base._credentials_project_mapping[cache_key]
            assert isinstance(cached_entry, tuple)
            cached_creds, cached_project = cached_entry
            assert cached_creds.token == "refreshed-token"
            assert not cached_creds.expired
            assert cached_project == "project-1"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_cache_with_different_project_id_combinations(self, is_async):
        """Test caching behavior with different project_id parameter combinations"""
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "token-1"
        mock_creds.expired = False
        mock_creds.project_id = "cred-project"
        mock_creds.quota_project_id = "cred-project"

        credentials = {"type": "service_account", "project_id": "cred-project"}

        with patch.object(
            vertex_base, "load_auth", return_value=(mock_creds, "cred-project")
        ):
            # First call with explicit project_id
            if is_async:
                token1, project1 = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id="explicit-project",
                    custom_llm_provider="vertex_ai",
                )
            else:
                token1, project1 = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id="explicit-project",
                    custom_llm_provider="vertex_ai",
                )

            # Second call with None project_id (should use credential project)
            if is_async:
                token2, project2 = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token2, project2 = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            assert token1 == "token-1"
            assert project1 == "explicit-project"  # Should use explicit project_id
            assert token2 == "token-1"
            assert project2 == "cred-project"  # Should use credential project_id

            # Verify separate cache entries
            explicit_cache_key = (json.dumps(credentials), "explicit-project")
            none_cache_key = (json.dumps(credentials), None)
            resolved_cache_key = (json.dumps(credentials), "cred-project")

            assert explicit_cache_key in vertex_base._credentials_project_mapping
            assert none_cache_key in vertex_base._credentials_project_mapping
            assert resolved_cache_key in vertex_base._credentials_project_mapping

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_project_id_resolution_and_caching_core_issue(self, is_async):
        """
        When user doesn't provide project_id, system should resolve it from credentials
        and cache the resolved project_id for future calls without calling load_auth again.
        """
        vertex_base = VertexBase()

        mock_creds = MagicMock()
        mock_creds.token = "token-from-creds"
        mock_creds.expired = False
        mock_creds.project_id = "resolved-from-credentials"
        mock_creds.quota_project_id = "resolved-from-credentials"

        # User provides credentials but NO project_id (this is the key scenario)
        credentials = {"type": "service_account"}

        with patch.object(
            vertex_base,
            "load_auth",
            return_value=(mock_creds, "resolved-from-credentials"),
        ) as mock_load_auth:

            # First call: User provides NO project_id, should resolve from credentials
            if is_async:
                token1, project1 = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,  # Key: user doesn't provide project_id
                    custom_llm_provider="vertex_ai",
                )
            else:
                token1, project1 = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,  # Key: user doesn't provide project_id
                    custom_llm_provider="vertex_ai",
                )

            # Should have called load_auth once to resolve project_id
            assert mock_load_auth.call_count == 1
            assert token1 == "token-from-creds"
            assert project1 == "resolved-from-credentials"

            # Verify cache contains both the original key and resolved key
            original_cache_key = (json.dumps(credentials), None)
            resolved_cache_key = (json.dumps(credentials), "resolved-from-credentials")

            assert original_cache_key in vertex_base._credentials_project_mapping
            assert resolved_cache_key in vertex_base._credentials_project_mapping

            # Both should contain the tuple with resolved project_id
            original_entry = vertex_base._credentials_project_mapping[
                original_cache_key
            ]
            resolved_entry = vertex_base._credentials_project_mapping[
                resolved_cache_key
            ]

            assert isinstance(original_entry, tuple)
            assert isinstance(resolved_entry, tuple)
            assert original_entry[1] == "resolved-from-credentials"
            assert resolved_entry[1] == "resolved-from-credentials"

            # Second call: Same scenario - should use cache and NOT call load_auth again
            if is_async:
                token2, project2 = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,  # Still no project_id provided
                    custom_llm_provider="vertex_ai",
                )
            else:
                token2, project2 = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,  # Still no project_id provided
                    custom_llm_provider="vertex_ai",
                )

            # Should NOT have called load_auth again (still 1 call total)
            assert mock_load_auth.call_count == 1
            assert token2 == "token-from-creds"
            assert project2 == "resolved-from-credentials"

            # Third call: Now user provides the resolved project_id explicitly
            # This should also use cache (the resolved_cache_key)
            if is_async:
                token3, project3 = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id="resolved-from-credentials",  # Explicit resolved project_id
                    custom_llm_provider="vertex_ai",
                )
            else:
                token3, project3 = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id="resolved-from-credentials",  # Explicit resolved project_id
                    custom_llm_provider="vertex_ai",
                )

            # Should still NOT have called load_auth again (cache hit)
            assert mock_load_auth.call_count == 1
            assert token3 == "token-from-creds"
            assert project3 == "resolved-from-credentials"

    @pytest.mark.parametrize(
        "api_base, vertex_location, expected",
        [
            (None, "us-central1", "https://us-central1-aiplatform.googleapis.com"),
            (None, "global", "https://aiplatform.googleapis.com"),
            (
                "https://us-central1-aiplatform.googleapis.com",
                "us-central1",
                "https://us-central1-aiplatform.googleapis.com",
            ),
            (
                "https://aiplatform.googleapis.com",
                "global",
                "https://aiplatform.googleapis.com",
            ),
            (
                "https://us-central1-aiplatform.googleapis.com",
                "global",
                "https://us-central1-aiplatform.googleapis.com",
            ),
            (
                "https://aiplatform.googleapis.com",
                "us-central1",
                "https://aiplatform.googleapis.com",
            ),
        ],
    )
    def test_get_api_base(self, api_base, vertex_location, expected):
        vertex_base = VertexBase()
        assert (
            vertex_base.get_api_base(api_base=api_base, vertex_location=vertex_location)
            == expected
        ), f"Expected {expected} with api_base {api_base} and vertex_location {vertex_location}"

    @pytest.mark.parametrize(
        "api_base, custom_llm_provider, gemini_api_key, endpoint, stream, auth_header, url, model, expected_auth_header, expected_url",
        [
            # Test case 1: Gemini with custom API base
            (
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                "gemini",
                "test-api-key",
                "generateContent",
                False,
                None,
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                {"x-goog-api-key": "test-api-key"},
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            ),
            # Test case 2: Gemini with custom API base and streaming
            (
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                "gemini",
                "test-api-key",
                "generateContent",
                True,
                None,
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                {"x-goog-api-key": "test-api-key"},
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent?alt=sse",
            ),
            # Test case 3: Non-Gemini provider with custom API base
            (
                "https://custom-vertex-api.com",
                "vertex_ai",
                None,
                "generateContent",
                False,
                "Bearer token123",
                "https://aiplatform.googleapis.com/v1/projects/test-project/locations/us-central1/publishers/google/models/gemini-pro:generateContent",
                "gemini-pro",
                "Bearer token123",
                "https://custom-vertex-api.com:generateContent",
            ),
            # Test case 4: No API base provided (should return original values)
            (
                None,
                "gemini",
                "test-api-key",
                "generateContent",
                False,
                "Bearer token123",
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                "Bearer token123",
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            ),
            # Test case 5: Gemini without API key (should raise ValueError)
            (
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                "gemini",
                None,
                "generateContent",
                False,
                None,
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                None,  # This should raise an exception
                None,
            ),
        ],
    )
    def test_check_custom_proxy(
        self,
        api_base,
        custom_llm_provider,
        gemini_api_key,
        endpoint,
        stream,
        auth_header,
        url,
        model,
        expected_auth_header,
        expected_url,
    ):
        """Test the _check_custom_proxy method for handling custom API base URLs"""
        vertex_base = VertexBase()

        if custom_llm_provider == "gemini" and api_base and gemini_api_key is None:
            # Test case 5: Should raise ValueError for Gemini without API key
            with pytest.raises(ValueError, match="Missing gemini_api_key"):
                vertex_base._check_custom_proxy(
                    api_base=api_base,
                    custom_llm_provider=custom_llm_provider,
                    gemini_api_key=gemini_api_key,
                    endpoint=endpoint,
                    stream=stream,
                    auth_header=auth_header,
                    url=url,
                    model=model,
                )
        else:
            # Test cases 1-4: Should work correctly
            result_auth_header, result_url = vertex_base._check_custom_proxy(
                api_base=api_base,
                custom_llm_provider=custom_llm_provider,
                gemini_api_key=gemini_api_key,
                endpoint=endpoint,
                stream=stream,
                auth_header=auth_header,
                url=url,
                model=model,
            )

            assert (
                result_auth_header == expected_auth_header
            ), f"Expected auth_header {expected_auth_header}, got {result_auth_header}"
            assert (
                result_url == expected_url
            ), f"Expected URL {expected_url}, got {result_url}"

    def test_check_custom_proxy_gemini_url_construction(self):
        """Test that Gemini URLs are constructed correctly with custom API base"""
        vertex_base = VertexBase()

        # Test various Gemini models with custom API base
        test_cases = [
            (
                "gemini-2.5-flash-lite",
                "generateContent",
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            ),
            (
                "gemini-2.5-pro",
                "generateContent",
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro:generateContent",
            ),
            (
                "gemini-1.5-flash",
                "streamGenerateContent",
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:streamGenerateContent",
            ),
        ]

        for model, endpoint, expected_url in test_cases:
            _, result_url = vertex_base._check_custom_proxy(
                api_base="https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                custom_llm_provider="gemini",
                gemini_api_key="test-api-key",
                endpoint=endpoint,
                stream=False,
                auth_header=None,
                url=f"https://generativelanguage.googleapis.com/v1beta/models/{model}:{endpoint}",
                model=model,
            )

            assert (
                result_url == expected_url
            ), f"Expected {expected_url}, got {result_url} for model {model}"

    def test_check_custom_proxy_streaming_parameter(self):
        """Test that streaming parameter correctly adds ?alt=sse to URLs"""
        vertex_base = VertexBase()

        # Test with streaming enabled
        _, result_url_streaming = vertex_base._check_custom_proxy(
            api_base="https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
            custom_llm_provider="gemini",
            gemini_api_key="test-api-key",
            endpoint="generateContent",
            stream=True,
            auth_header=None,
            url="https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            model="gemini-2.5-flash-lite",
        )

        expected_streaming_url = "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent?alt=sse"
        assert (
            result_url_streaming == expected_streaming_url
        ), f"Expected {expected_streaming_url}, got {result_url_streaming}"

        # Test with streaming disabled
        _, result_url_no_streaming = vertex_base._check_custom_proxy(
            api_base="https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
            custom_llm_provider="gemini",
            gemini_api_key="test-api-key",
            endpoint="generateContent",
            stream=False,
            auth_header=None,
            url="https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            model="gemini-2.5-flash-lite",
        )

        expected_no_streaming_url = "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent"
        assert (
            result_url_no_streaming == expected_no_streaming_url
        ), f"Expected {expected_no_streaming_url}, got {result_url_no_streaming}"

    @pytest.mark.parametrize(
        "api_base, custom_llm_provider, gemini_api_key, endpoint, stream, auth_header, url, model, expected_auth_header, expected_url",
        [
            # Test case 1: Gemini with custom API base
            (
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                "gemini",
                "test-api-key",
                "generateContent",
                False,
                None,
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                {"x-goog-api-key": "test-api-key"},
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
            ),
            # Test case 2: Gemini with custom API base and streaming
            (
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta",
                "gemini",
                "test-api-key",
                "generateContent",
                True,
                None,
                "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent",
                "gemini-2.5-flash-lite",
                {"x-goog-api-key": "test-api-key"},
                "https://proxy.example.com/generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash-lite:generateContent?alt=sse",
            ),
        ],
    )
    def test_check_custom_proxy_minimal_gemini_key_param(
        self,
        api_base,
        custom_llm_provider,
        gemini_api_key,
        endpoint,
        stream,
        auth_header,
        url,
        model,
        expected_auth_header,
        expected_url,
    ):
        """Single focused test to ensure ?key is appended (and &alt=sse for streaming)."""
        vertex_base = VertexBase()
        result_auth_header, result_url = vertex_base._check_custom_proxy(
            api_base=api_base,
            custom_llm_provider=custom_llm_provider,
            gemini_api_key=gemini_api_key,
            endpoint=endpoint,
            stream=stream,
            auth_header=auth_header,
            url=url,
            model=model,
        )
        assert result_auth_header == expected_auth_header
        assert result_url == expected_url

    def test_credentials_from_identity_pool_implementation(self):
        """Test the actual implementation of _credentials_from_identity_pool"""
        vertex_base = VertexBase()
        json_obj = {"type": "external_account", "audience": "test"}
        scopes = ["https://www.googleapis.com/auth/cloud-platform"]

        # Mock the credentials object
        mock_creds = MagicMock()
        mock_creds.requires_scopes = True
        mock_creds.with_scopes.return_value = "scoped_creds"

        # Mock the identity_pool module
        with patch("google.auth.identity_pool.Credentials") as MockCredentials:
            MockCredentials.from_info.return_value = mock_creds

            # Call the method
            result = vertex_base._credentials_from_identity_pool(json_obj, scopes)

            # Verify calls
            MockCredentials.from_info.assert_called_once_with(json_obj)
            mock_creds.with_scopes.assert_called_once_with(scopes)
            assert result == "scoped_creds"

    def test_credentials_from_identity_pool_no_scopes_needed(self):
        """Test _credentials_from_identity_pool when scopes are not needed"""
        vertex_base = VertexBase()
        json_obj = {"type": "external_account", "audience": "test"}
        scopes = ["https://www.googleapis.com/auth/cloud-platform"]

        # Mock the credentials object
        mock_creds = MagicMock()
        mock_creds.requires_scopes = False  # Scopes not required

        # Mock the identity_pool module
        with patch("google.auth.identity_pool.Credentials") as MockCredentials:
            MockCredentials.from_info.return_value = mock_creds

            # Call the method
            result = vertex_base._credentials_from_identity_pool(json_obj, scopes)

            # Verify calls
            MockCredentials.from_info.assert_called_once_with(json_obj)
            mock_creds.with_scopes.assert_not_called()
            assert result == mock_creds

    def test_credentials_from_identity_pool_with_aws_implementation(self):
        """Test the actual implementation of _credentials_from_identity_pool_with_aws"""
        vertex_base = VertexBase()
        json_obj = {
            "type": "external_account",
            "credential_source": {"environment_id": "aws1"},
        }
        scopes = ["https://www.googleapis.com/auth/cloud-platform"]

        # Mock the credentials object
        mock_creds = MagicMock()
        mock_creds.requires_scopes = True
        mock_creds.with_scopes.return_value = "scoped_creds"

        # Mock the aws module
        with patch("google.auth.aws.Credentials") as MockCredentials:
            MockCredentials.from_info.return_value = mock_creds

            # Call the method
            result = vertex_base._credentials_from_identity_pool_with_aws(
                json_obj, scopes
            )

            # Verify calls
            MockCredentials.from_info.assert_called_once_with(json_obj)
            mock_creds.with_scopes.assert_called_once_with(scopes)
            assert result == "scoped_creds"

    def test_extract_aws_params(self):
        """Test _extract_aws_params: extraction, empty case, and unrecognized keys."""
        # Case 1: Extracts recognized aws_* keys, ignores GCP-standard fields
        json_with_role = {
            "type": "external_account",
            "audience": "//iam.googleapis.com/...",
            "token_url": "https://sts.googleapis.com/v1/token",
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }
        result = VertexAIAwsWifAuth.extract_aws_params(json_with_role)
        assert result == {
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }

        # Case 2: Returns empty dict for standard WIF JSON (no aws_* keys)
        json_standard = {
            "type": "external_account",
            "audience": "//iam.googleapis.com/...",
            "credential_source": {"environment_id": "aws1"},
        }
        assert VertexAIAwsWifAuth.extract_aws_params(json_standard) == {}

        # Case 3: Ignores unrecognized aws_* keys (e.g. aws_bedrock_runtime_endpoint)
        json_with_unknown = {
            "type": "external_account",
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
            "aws_unknown_field": "should-be-ignored",
            "aws_bedrock_runtime_endpoint": "should-also-be-ignored",
        }
        result = VertexAIAwsWifAuth.extract_aws_params(json_with_unknown)
        assert result == {
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }

    def test_credentials_from_aws_with_explicit_auth(self):
        """Test that explicit AWS auth creates credentials via supplier, not metadata."""
        json_obj = {
            "type": "external_account",
            "audience": "//iam.googleapis.com/projects/123/locations/global/workloadIdentityPools/pool/providers/aws",
            "subject_token_type": "urn:ietf:params:aws:token-type:aws4_request",
            "token_url": "https://sts.googleapis.com/v1/token",
            "service_account_impersonation_url": "https://iamcredentials.googleapis.com/v1/projects/-/serviceAccounts/sa@proj.iam.gserviceaccount.com:generateAccessToken",
            "credential_source": {"environment_id": "aws1"},
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }
        aws_params = {
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }
        scopes = ["https://www.googleapis.com/auth/cloud-platform"]

        # Mock BaseAWSLLM.get_credentials to return fake boto3 credentials
        mock_boto3_creds = MagicMock()
        mock_boto3_creds.access_key = "AKIAIOSFODNN7EXAMPLE"
        mock_boto3_creds.secret_key = "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
        mock_boto3_creds.token = "FwoGZXIvYXdzEBYaDHqa0AP"

        # Mock aws.Credentials constructor
        mock_gcp_creds = MagicMock()
        mock_gcp_creds.requires_scopes = True
        mock_gcp_creds.with_scopes.return_value = mock_gcp_creds

        # IMPORTANT: Patch at the SOURCE modules, not at vertex_llm_base level.
        # The imports happen inside the function via `from X import Y`, so
        # the mock must replace the class in its defining module.
        with patch(
            "litellm.llms.bedrock.base_aws_llm.BaseAWSLLM"
        ) as MockBaseAWSLLM, patch(
            "google.auth.aws.Credentials",
        ) as MockAwsCredentials:
            mock_base_aws = MagicMock()
            mock_base_aws.get_credentials.return_value = mock_boto3_creds
            MockBaseAWSLLM.return_value = mock_base_aws
            MockAwsCredentials.return_value = mock_gcp_creds

            result = VertexAIAwsWifAuth.credentials_from_explicit_aws(
                json_obj, aws_params, scopes
            )

            # Verify aws.Credentials was called with supplier (not from_info)
            MockAwsCredentials.assert_called_once()
            call_kwargs = MockAwsCredentials.call_args[1]
            assert call_kwargs["audience"] == json_obj["audience"]
            assert call_kwargs["subject_token_type"] == json_obj["subject_token_type"]
            assert call_kwargs["token_url"] == json_obj["token_url"]
            assert call_kwargs["credential_source"] is None
            assert call_kwargs["service_account_impersonation_url"] == json_obj["service_account_impersonation_url"]

            # Verify the supplier is a lazy credentials provider (calls
            # get_credentials on demand, not at construction time)
            supplier = call_kwargs["aws_security_credentials_supplier"]
            assert supplier is not None
            # Trigger the lazy provider — this should call get_credentials
            supplier.get_aws_security_credentials(context=None, request=None)
            mock_base_aws.get_credentials.assert_called_once_with(**aws_params)

            # Verify scopes were applied
            mock_gcp_creds.with_scopes.assert_called_once_with(scopes)
            assert result == mock_gcp_creds

    def test_credentials_from_aws_with_explicit_auth_requires_region(self):
        """Test that explicit AWS auth raises ValueError when region is missing."""
        json_obj = {
            "type": "external_account",
            "audience": "//iam.googleapis.com/...",
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
        }
        aws_params = {
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            # No aws_region_name — should fail
        }
        scopes = ["https://www.googleapis.com/auth/cloud-platform"]

        with pytest.raises(ValueError, match="aws_region_name is required"):
            VertexAIAwsWifAuth.credentials_from_explicit_aws(
                json_obj, aws_params, scopes
            )

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_aws_wif_routes_to_explicit_auth_when_aws_params_present(
        self, is_async
    ):
        """Test that load_auth routes to explicit auth when aws_* keys are in JSON."""
        vertex_base = VertexBase()

        credentials = {
            "type": "external_account",
            "credential_source": {"environment_id": "aws1"},
            "audience": "//iam.googleapis.com/...",
            "subject_token_type": "urn:ietf:params:aws:token-type:aws4_request",
            "token_url": "https://sts.googleapis.com/v1/token",
            "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
            "aws_region_name": "us-east-1",
        }

        mock_creds = MagicMock()
        mock_creds.token = "explicit-auth-token"
        mock_creds.expired = False
        mock_creds.project_id = "test-project"

        with patch(
            "litellm.llms.vertex_ai.vertex_ai_aws_wif.VertexAIAwsWifAuth.credentials_from_explicit_aws",
            return_value=mock_creds,
        ) as mock_explicit_auth, patch.object(
            vertex_base,
            "_credentials_from_identity_pool_with_aws",
        ) as mock_metadata_auth, patch.object(
            vertex_base, "refresh_auth"
        ) as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, _ = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, _ = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            # Explicit auth should be called, NOT metadata auth
            assert mock_explicit_auth.called
            mock_metadata_auth.assert_not_called()
            # Verify correct kwargs were passed to explicit auth
            call_kwargs = mock_explicit_auth.call_args[1]
            assert call_kwargs["aws_params"] == {
                "aws_role_name": "arn:aws:iam::123456789012:role/MyRole",
                "aws_region_name": "us-east-1",
            }
            assert call_kwargs["scopes"] == ["https://www.googleapis.com/auth/cloud-platform"]
            assert token == "refreshed-token"

    @pytest.mark.parametrize("is_async", [True, False], ids=["async", "sync"])
    @pytest.mark.asyncio
    async def test_aws_wif_falls_back_to_metadata_when_no_aws_params(self, is_async):
        """Test that load_auth falls back to metadata flow when no aws_* keys in JSON."""
        vertex_base = VertexBase()

        # Standard WIF JSON — no aws_* keys
        credentials = {
            "type": "external_account",
            "credential_source": {"environment_id": "aws1"},
            "audience": "//iam.googleapis.com/...",
            "token_url": "https://sts.googleapis.com/v1/token",
        }

        mock_creds = MagicMock()
        mock_creds.token = "metadata-token"
        mock_creds.expired = False
        mock_creds.project_id = "test-project"

        with patch(
            "litellm.llms.vertex_ai.vertex_ai_aws_wif.VertexAIAwsWifAuth.credentials_from_explicit_aws",
        ) as mock_explicit_auth, patch.object(
            vertex_base,
            "_credentials_from_identity_pool_with_aws",
            return_value=mock_creds,
        ) as mock_metadata_auth, patch.object(
            vertex_base, "refresh_auth"
        ) as mock_refresh:

            def mock_refresh_impl(creds):
                creds.token = "refreshed-token"

            mock_refresh.side_effect = mock_refresh_impl

            if is_async:
                token, _ = await vertex_base._ensure_access_token_async(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )
            else:
                token, _ = vertex_base._ensure_access_token(
                    credentials=credentials,
                    project_id=None,
                    custom_llm_provider="vertex_ai",
                )

            # Metadata auth should be called, NOT explicit auth
            mock_explicit_auth.assert_not_called()
            assert mock_metadata_auth.called
            assert token == "refreshed-token"

    def test_aws_credentials_supplier(self):
        """Test AwsCredentialsSupplier: wraps credentials provider, handles token=None."""
        from litellm.llms.vertex_ai.aws_credentials_supplier import (
            AwsCredentialsSupplier,
        )

        # Case 1: With session token (STS temporary credentials)
        mock_boto3_creds = MagicMock()
        mock_boto3_creds.access_key = "AKIAIOSFODNN7EXAMPLE"
        mock_boto3_creds.secret_key = "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
        mock_boto3_creds.token = "FwoGZXIvYXdzEBYaDHqa0AP"

        supplier = AwsCredentialsSupplier(
            credentials_provider=lambda: mock_boto3_creds,
            aws_region="us-east-1",
        )

        aws_creds = supplier.get_aws_security_credentials(context=None, request=None)
        assert aws_creds.access_key_id == "AKIAIOSFODNN7EXAMPLE"
        assert aws_creds.secret_access_key == "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
        assert aws_creds.session_token == "FwoGZXIvYXdzEBYaDHqa0AP"
        assert supplier.get_aws_region(context=None, request=None) == "us-east-1"

        # Case 2: Without session token (static IAM credentials)
        mock_static_creds = MagicMock()
        mock_static_creds.access_key = "AKIAIOSFODNN7EXAMPLE"
        mock_static_creds.secret_key = "wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY"
        mock_static_creds.token = None

        supplier_static = AwsCredentialsSupplier(
            credentials_provider=lambda: mock_static_creds,
            aws_region="eu-west-1",
        )

        aws_creds_static = supplier_static.get_aws_security_credentials(
            context=None, request=None
        )
        assert aws_creds_static.access_key_id == "AKIAIOSFODNN7EXAMPLE"
        assert aws_creds_static.session_token is None

    def test_aws_credentials_supplier_returns_correct_type(self):
        """Test that AwsCredentialsSupplier returns AwsSecurityCredentials dataclass."""
        from google.auth.aws import AwsSecurityCredentials

        from litellm.llms.vertex_ai.aws_credentials_supplier import (
            AwsCredentialsSupplier,
        )

        mock_boto3_creds = MagicMock()
        mock_boto3_creds.access_key = "AKID"
        mock_boto3_creds.secret_key = "SECRET"
        mock_boto3_creds.token = "TOKEN"

        supplier = AwsCredentialsSupplier(
            credentials_provider=lambda: mock_boto3_creds,
            aws_region="us-east-1",
        )

        aws_creds = supplier.get_aws_security_credentials(context=None, request=None)
        assert isinstance(aws_creds, AwsSecurityCredentials)