Source code for xraylabtool.analysis.comparator

"""Material comparison functionality for X-ray properties analysis."""

from dataclasses import dataclass
from typing import Any

import numpy as np
import pandas as pd

from xraylabtool.calculators.core import calculate_xray_properties



[docs]
@dataclass
class ComparisonResult:
    """Result container for material comparisons."""

    materials: list[str]
    energies: list[float]
    properties: list[str]
    data: dict[str, Any]
    summary_stats: dict[str, dict[str, float]]
    recommendations: list[str]




[docs]
class MaterialComparator:
    """Compare X-ray properties between multiple materials."""


[docs]
    def __init__(self):  # type: ignore[no-untyped-def]
        self.default_properties = [
            "critical_angle_degrees",
            "attenuation_length_cm",
            "dispersion_delta",
            "absorption_beta",
        ]



[docs]
    def compare_materials(
        self,
        formulas: list[str],
        densities: list[float],
        energies: list[float],
        properties: list[str] | None = None,
    ) -> ComparisonResult:
        """
        Compare X-ray properties across multiple materials.

        Args:
            formulas: List of chemical formulas
            densities: List of material densities in g/cm³
            energies: List of X-ray energies in keV
            properties: Properties to compare (uses defaults if None)

        Returns:
            ComparisonResult with comparison data
        """
        if len(formulas) != len(densities):
            raise ValueError("Number of formulas must match number of densities")

        if len(formulas) < 2:
            raise ValueError("At least two materials required for comparison")

        if not energies:
            raise ValueError("At least one energy value required")

        # Use default properties if none specified
        if properties is None:
            properties = self.default_properties.copy()

        # Calculate X-ray properties for all materials
        material_data = {}
        for _i, (formula, density) in enumerate(zip(formulas, densities, strict=False)):
            try:
                result_dict = calculate_xray_properties(
                    formulas=[formula], energies=energies, densities=[density]
                )
                # Extract the XRayResult object from the dictionary
                xray_result = result_dict[formula]
                material_key = f"{formula} ({density} g/cm³)"
                material_data[material_key] = xray_result
            except Exception as e:
                raise ValueError(f"Failed to calculate properties for {formula}: {e}")

        # Extract comparison data
        comparison_data = {}  # type: ignore[var-annotated]
        for prop in properties:
            comparison_data[prop] = {}
            for material_key, xray_result in material_data.items():
                if hasattr(xray_result, prop):
                    values = getattr(xray_result, prop)
                    if isinstance(values, np.ndarray):
                        comparison_data[prop][material_key] = values.tolist()
                    else:
                        comparison_data[prop][material_key] = [values] * len(energies)

        # Calculate summary statistics
        summary_stats = {}
        for prop in properties:
            if prop in comparison_data:
                prop_data = comparison_data[prop]
                all_values = []
                for material_values in prop_data.values():
                    all_values.extend(material_values)

                if all_values:
                    summary_stats[prop] = {
                        "mean": float(np.mean(all_values)),
                        "std": float(np.std(all_values)),
                        "min": float(np.min(all_values)),
                        "max": float(np.max(all_values)),
                        "range": float(np.max(all_values) - np.min(all_values)),
                    }

        # Generate recommendations
        recommendations = self._generate_recommendations(
            formulas, comparison_data, summary_stats, energies
        )

        return ComparisonResult(
            materials=[
                f"{f} ({d} g/cm³)" for f, d in zip(formulas, densities, strict=False)
            ],
            energies=energies,
            properties=properties,
            data=comparison_data,
            summary_stats=summary_stats,
            recommendations=recommendations,
        )



[docs]
    def create_comparison_table(self, result: ComparisonResult) -> pd.DataFrame:
        """
        Create a pandas DataFrame from comparison results.

        Args:
            result: ComparisonResult object

        Returns:
            DataFrame with comparison data
        """
        rows = []

        for i, energy in enumerate(result.energies):
            for material in result.materials:
                row = {"Material": material, "Energy_keV": energy}

                for prop in result.properties:
                    if prop in result.data and material in result.data[prop]:
                        values = result.data[prop][material]
                        val = None
                        if len(values):
                            val = values[i] if i < len(values) else values[0]
                        # Coerce length-1 numpy arrays to plain float
                        try:
                            if hasattr(val, "__len__") and not isinstance(
                                val, (str, bytes)
                            ):
                                if len(val) == 1:  # type: ignore[arg-type]
                                    val = val[0]  # type: ignore[index]
                            if val is not None:
                                try:
                                    val = float(val)
                                except Exception:
                                    # numpy scalar fallback
                                    val = float(np.asarray(val).squeeze())
                        except Exception:
                            val = None
                        row[prop] = val
                    else:
                        row[prop] = None

                rows.append(row)

        return pd.DataFrame(rows)



[docs]
    def generate_comparison_report(self, result: ComparisonResult) -> str:
        """
        Generate a detailed text report from comparison results.

        Args:
            result: ComparisonResult object

        Returns:
            Formatted text report
        """
        lines = []
        lines.append("X-RAY PROPERTIES COMPARISON REPORT")
        lines.append("=" * 50)
        lines.append("")

        # Materials summary
        lines.append("MATERIALS COMPARED:")
        for i, material in enumerate(result.materials, 1):
            lines.append(f"  {i}. {material}")
        lines.append("")

        # Energy range
        if len(result.energies) == 1:
            lines.append(f"ENERGY: {result.energies[0]:.3f} keV")
        else:
            lines.append(
                f"ENERGY RANGE: {min(result.energies):.3f} - {max(result.energies):.3f} keV"
            )
            lines.append(f"  ({len(result.energies)} energy points)")
        lines.append("")

        # Properties summary
        lines.append("PROPERTIES ANALYZED:")
        for prop in result.properties:
            lines.append(f"  • {prop.replace('_', ' ').title()}")
        lines.append("")

        # Summary statistics
        if result.summary_stats:
            lines.append("SUMMARY STATISTICS:")
            lines.append("-" * 30)
            for prop, stats in result.summary_stats.items():
                lines.append(f"\n{prop.replace('_', ' ').title()}:")
                lines.append(f"  Mean: {stats['mean']:.6g}")
                lines.append(f"  Std:  {stats['std']:.6g}")
                lines.append(f"  Min:  {stats['min']:.6g}")
                lines.append(f"  Max:  {stats['max']:.6g}")
                lines.append(f"  Range: {stats['range']:.6g}")
            lines.append("")

        # Material rankings (for single energy)
        if len(result.energies) == 1:
            lines.append("MATERIAL RANKINGS:")
            lines.append("-" * 20)

            for prop in result.properties:
                if prop in result.data:
                    prop_data = result.data[prop]
                    # Sort materials by property value
                    sorted_materials = sorted(
                        prop_data.items(),
                        key=lambda x: x[1][0] if x[1] else 0,
                        reverse=True,
                    )

                    lines.append(
                        f"\n{prop.replace('_', ' ').title()} (highest to lowest):"
                    )
                    for i, (material, values) in enumerate(sorted_materials, 1):
                        value = values[0] if values else 0
                        lines.append(f"  {i}. {material}: {value:.6g}")
            lines.append("")

        # Recommendations
        if result.recommendations:
            lines.append("RECOMMENDATIONS:")
            lines.append("-" * 15)
            for i, rec in enumerate(result.recommendations, 1):
                lines.append(f"{i}. {rec}")
            lines.append("")

        lines.append("Report generated by XRayLabTool")

        return "\n".join(lines)


    def _generate_recommendations(
        self,
        _formulas: list[str],
        data: dict[str, Any],
        stats: dict[str, dict[str, float]],
        energies: list[float],
    ) -> list[str]:
        """Generate analysis recommendations based on comparison results."""
        recommendations = []

        # Check for significant differences
        for prop, prop_stats in stats.items():
            if (
                prop_stats["std"] / prop_stats["mean"] > 0.5
            ):  # High coefficient of variation
                recommendations.append(
                    f"Large variation in {prop.replace('_', ' ')} across materials - "
                    "consider this for material selection"
                )

        # Energy-specific recommendations
        if len(energies) > 1:
            recommendations.append(
                "Multiple energies analyzed - check energy-dependent behavior for optimal selection"
            )

        # Critical angle recommendations
        if "critical_angle_degrees" in data:
            recommendations.append(
                "For grazing incidence applications, materials with larger critical angles "
                "provide better penetration"
            )

        # Attenuation recommendations
        if "attenuation_length_cm" in data:
            recommendations.append(
                "For transmission applications, materials with longer attenuation lengths "
                "are preferred"
            )

        if not recommendations:
            recommendations.append(
                "All materials show similar X-ray properties at the given energies"
            )

        return recommendations