Source code for pns

"""Principal nested spheres (PNS) analysis [1]_.

.. [1] Jung, Sungkyu, Ian L. Dryden, and James Stephen Marron.
       "Analysis of principal nested spheres." Biometrika 99.3 (2012): 551-568.
"""

import numpy as np

from .base import extrinsic_to_intrinsic, intrinsic_to_extrinsic
from .pss import pss
from .transformers import embed, inverse_project, project, reconstruct

__all__ = [
    "pns",
    "fit_transform",
    "transform",
    "inverse_transform",
]



[docs]
def pns(x, n_components, tol=1e-3, maxiter=None, lm_kwargs=None):
    r"""Principal nested spheres analysis.

    Parameters
    ----------
    x : real array of shape (N, d+1)
        Data on a d-sphere.
    n_components : int
        Target dimension.
    tol : float, default=1e-3
        Convergence tolerance in radians.
    maxiter : int, optional
        Maximum number of iterations for the optimization.
        If None, the number of iterations is not checked.
    lm_kwargs : dict, optional
        Additional keyword arguments to be passed for Levenberg-Marquardt optimization.
        Passed to :func:`pns.pss`.

    Returns
    -------
    vs : list of array
        Principal axes.
    rs : 1-D array of length (d+1-n_components)
        Principal geodesic distances.
    xis : 2-D array of shape (N, d+1-n_components)
        Unscaled residuals.
    x_transform : real array of shape (N, n_components)
        Data transformed onto low-dimensional sphere.

    Notes
    -----
    The input data is :math:`x \in S^d \subset \mathbb{R}^{d+1}`.

    The :math:`k`-th element of *vs*, *rs* and *xis* are:

    1. The principal axis :math:`\hat{v}_{k} \in S^{d-k+1} \subset \mathbb{R}^{d-k+2}`,
    2. The principal geodesic distance :math:`\hat{r}_k \in \mathbb{R}`, and
    3. Unscaled residual :math:`\xi_{d-k}`.

    Examples
    --------
    >>> from pns import pns
    >>> from pns.util import unit_sphere, circular_data, circle_3d
    >>> x = circular_data([0, -1, 0])
    >>> vs, rs, _, x_transform = pns(x, 2)
    >>> import matplotlib.pyplot as plt  # doctest: +SKIP
    ... fig = plt.figure()
    ... ax1 = fig.add_subplot(121, projection='3d', computed_zorder=False)
    ... ax1.plot_surface(*unit_sphere(), color='skyblue', alpha=0.6, edgecolor='gray')
    ... ax1.scatter(*x.T)
    ... ax1.scatter(*vs[0])
    ... ax1.plot(*circle_3d(vs[0], rs[0]), color="tab:orange", zorder=10)
    ... ax2 = fig.add_subplot(122)
    ... ax2.scatter(*x_transform.T)
    ... ax2.set_aspect("equal")
    """
    dtype = x.dtype
    N, d_plus_one = x.shape
    M = d_plus_one - n_components

    vs = []
    rs = np.empty((M,), dtype=dtype)
    xis = np.empty((N, M), dtype=dtype)
    for i in range(M):
        v, r = pss(x, tol, maxiter, lm_kwargs)  # v_k, r_k
        P, xi = project(x, v, r)
        if len(v) > 2:
            x = embed(P, v, r)
        else:
            x = np.zeros((len(x), 1))

        vs.append(v.astype(dtype))
        rs[i] = r
        xis[:, [i]] = xi
    return vs, rs, xis, x.astype(dtype)




[docs]
def fit_transform(
    X, n_components, type="intrinsic", tol=1e-3, maxiter=None, lm_kwargs=None
):
    """Fit PNS and transform data into low-dimensional hypersphere.

    Parameters
    ----------
    X : real array of shape (N, d+1)
        Extrinsic coordinates of data on a ``d``-dimensional hypersphere,
        embedded in a ``d+1``-dimensional space.
    n_components : int
        Target dimension.
    type : {'intrinsic', 'extrinsic'}
        Type of the output coordinates.
    tol : float, default=1e-3
        Convergence tolerance in radians.
    maxiter : int, optional
        Maximum number of iterations for the optimization.
        If None, the number of iterations is not checked.
    lm_kwargs : dict, optional
        Additional keyword arguments to be passed for Levenberg-Marquardt optimization.
        Passed to :func:`pns.pns`.

    Returns
    -------
    vs : list of array
        Principal axes.
    rs : 1-D array of length (d+1-n_components)
        Principal geodesic distances.
    X_transform : array of shape (N, n_components)
        Coordinates of transformed data on a low-dimensional unit hypersphere.

    Examples
    --------
    Extrinsic transformation:

    >>> from pns import fit_transform
    >>> from pns.util import circular_data
    >>> x = circular_data([0, -1, 0])
    >>> _, _, x_transformed = fit_transform(x, n_components=2, type='extrinsic')
    >>> import matplotlib.pyplot as plt  # doctest: +SKIP
    ... plt.scatter(*x_transformed.T)
    ... plt.gca().set_aspect("equal")

    Intrinsic transformation:

    >>> import numpy as np
    >>> from pns.util import unit_sphere
    >>> _, _, x_transformed = fit_transform(x, n_components=2, type='intrinsic')
    >>> fig = plt.figure()  # doctest: +SKIP
    ... ax1 = fig.add_subplot(121, projection='3d', computed_zorder=False)
    ... ax1.plot_surface(*unit_sphere(), color='skyblue', edgecolor='gray')
    ... ax1.scatter(*x.T, c=x_transformed[:, 0])
    ... ax2 = fig.add_subplot(122)
    ... ax2.scatter(*x_transformed.T, c=x_transformed[:, 0])
    ... ax2.set_xlim(-np.pi, np.pi)
    ... ax2.set_ylim(-np.pi/2, np.pi/2)
    """
    if type == "intrinsic":
        pns_dim = 1
    else:
        pns_dim = n_components
    vs, rs, xi, X_transform = pns(
        X, pns_dim, tol=tol, maxiter=maxiter, lm_kwargs=lm_kwargs
    )

    if type == "intrinsic":
        sin_r = 1
        for i in range(xi.shape[1] - 1):
            xi[:, i] *= sin_r
            sin_r *= np.sin(rs[i])
        xi[:, -1] *= sin_r

        ret = np.flip(xi, axis=-1)[:, :n_components]
    else:
        ret = X_transform
    return vs, rs, ret




[docs]
def transform(X, vs, rs, n_components, type="intrinsic"):
    """Transform data using the fitted PNS.

    Parameters
    ----------
    X : (N, d+1) real array
        Extrinsic coordinates of data on a ``d``-dimensional hypersphere,
        embedded in a ``d+1``-dimensional space.
    vs : list of k real arrays
        Subsphere axes.
    rs : list of k scalars
        Subsphere geodesic distances.
    n_components : int
        Target dimension.
    type : {'intrinsic', 'extrinsic'}
        Type of the output coordinates.

    Returns
    -------
    (N, n_components) real array
        Coordinates of transformed data on a low-dimensional unit hypersphere.

    Notes
    -----
    If *type* is ``intrinsic``, ``k`` must be ``d``.
    If *type* is ``extrinsic``, ``k`` must be at least ``d + 1 - n_components``.

    Examples
    --------
    Extrinsic transformation:

    >>> from pns import fit_transform, transform
    >>> from pns.util import circular_data
    >>> x = circular_data([0, -1, 0])
    >>> vs, rs, _ = fit_transform(x, n_components=2, type='extrinsic')
    >>> x_transformed = transform(x, vs, rs, n_components=2, type='extrinsic')
    >>> import matplotlib.pyplot as plt  # doctest: +SKIP
    ... plt.scatter(*x_transformed.T)
    ... plt.gca().set_aspect("equal")

    Intrinsic transformation:

    >>> import numpy as np
    >>> from pns.util import unit_sphere
    >>> vs, rs, _ = fit_transform(x, n_components=2, type='intrinsic')
    >>> x_transformed = transform(x, vs, rs, n_components=2, type='intrinsic')
    >>> fig = plt.figure()  # doctest: +SKIP
    ... ax1 = fig.add_subplot(121, projection='3d', computed_zorder=False)
    ... ax1.plot_surface(*unit_sphere(), color='skyblue', edgecolor='gray')
    ... ax1.scatter(*x.T, c=x_transformed[:, 0])
    ... ax2 = fig.add_subplot(122)
    ... ax2.scatter(*x_transformed.T, c=x_transformed[:, 0])
    ... ax2.set_xlim(-np.pi, np.pi)
    ... ax2.set_ylim(-np.pi/2, np.pi/2)
    """
    d = X.shape[1] - 1
    if type == "intrinsic":
        residuals = []

        sin_r = 1
        for k in range(1, d):
            v, r = vs[k - 1], rs[k - 1]
            P, xi = project(X, v, r)
            X = embed(P, v, r)
            Xi = sin_r * xi
            residuals.append(Xi)
            sin_r *= np.sin(r)

        v, r = vs[d - 1], rs[d - 1]
        _, xi = project(X, v, r)
        Xi = sin_r * xi
        residuals.append(Xi)

        ret = np.flip(np.concatenate(residuals, axis=-1), axis=-1)[:, :n_components]

    elif type == "extrinsic":
        k = d + 1 - n_components
        vs = vs[:k]
        rs = rs[:k]

        for v, r in zip(vs, rs):
            P, _ = project(X, v, r)
            X = embed(P, v, r)
        ret = X

    return ret




[docs]
def inverse_transform(X, vs, rs, type="intrinsic"):
    """Inverse-transform data using the fitted PNS.

    Parameters
    ----------
    X : (N, n_components) real array
        Coordinates of transformed data on a low-dimensional unit hypersphere.
    vs : list of k real arrays
        Subsphere axes.
    rs : list of k scalars
        Subsphere geodesic distances.
    type : {'intrinsic', 'extrinsic'}
        Type of the output coordinates.

    Returns
    -------
    (N, d+1) real array
        Extrinsic coordinates of data on a ``d``-dimensional hypersphere,
        embedded in a ``d+1``-dimensional space.

    Notes
    -----
    If *type* is ``intrinsic``, ``k`` must be ``d``.
    If *type* is ``extrinsic``, ``k`` must be at least ``d + 1 - n_components``.

    Examples
    --------
    Extrinsic transformation:

    >>> from pns import fit_transform, inverse_transform
    >>> from pns.util import circular_data, unit_sphere
    >>> x = circular_data([0, -1, 0])
    >>> vs, rs, x_transformed = fit_transform(x, n_components=2, type='extrinsic')
    >>> x_reconstructed = inverse_transform(x_transformed, vs, rs, type='extrinsic')
    >>> import matplotlib.pyplot as plt  # doctest: +SKIP
    ... fig = plt.figure()
    ... ax = fig.add_subplot(projection='3d', computed_zorder=False)
    ... ax.plot_surface(*unit_sphere(), color='skyblue', alpha=0.6, edgecolor='gray')
    ... ax.scatter(*x.T, marker=".", zorder=10)
    ... ax.scatter(*x_reconstructed.T, marker="x", zorder=10)

    Intrinsic transformation:

    >>> vs, rs, x_transformed = fit_transform(x, n_components=2, type='intrinsic')
    >>> x_reconstructed = inverse_transform(x_transformed, vs, rs, type='intrinsic')
    >>> import matplotlib.pyplot as plt  # doctest: +SKIP
    ... ax = plt.figure().add_subplot(projection='3d', computed_zorder=False)
    ... ax.plot_surface(*unit_sphere(), color='skyblue', edgecolor='gray')
    ... ax.scatter(*x.T, marker="o", zorder=10)
    ... ax.scatter(*x_reconstructed.T, marker="x", zorder=10)
    """
    if type == "intrinsic":
        Xi = X
        _, n = Xi.shape
        d = len(vs)

        Xi = np.concatenate(
            [Xi, np.zeros((Xi.shape[0], d - n))], axis=-1
        )  # Now, each column in Xi is Xi(0), ..., Xi(d-1).

        # Un-scale Xi, i.e., xi(d-k) = Xi(d-k) / prod_{i=1}^{k-1}(sin(r_i)).
        sin_rs = np.sin(rs[:-1])  # sin(r_1), sin(r_2), ..., sin(r_{d-1})
        xi = Xi  # xi(0), ..., xi(d-1)
        prod_sin_r = np.prod(sin_rs)
        for i in range(d - 1):
            xi[:, i] /= prod_sin_r
            prod_sin_r /= sin_rs[-i - 1]
        xi[:, d - 1] /= prod_sin_r

        # Starting from the lowest dimension,
        # 1. Convert to cartesian coordinates.
        # 2. Reconstruct to one higher dimension, with north pole different from v.
        # 3. Rotate for v.
        # 4. Un-project with residuals.
        # 5. Go to 2.

        # Initialize: rotate xi(0) and convert to cartesian
        xi[:, 0] += extrinsic_to_intrinsic(vs[-1][np.newaxis, ...])[0]
        x_dagger = intrinsic_to_extrinsic(xi[:, :1])

        # Step 2 to Step 5
        for i in range(d - 1):
            k = i + 1  # 1, 2, ..., d - 1
            A = reconstruct(x_dagger, vs[-1 - k], rs[-1 - k])
            x_dagger = inverse_project(A, np.sin(xi[:, k]), vs[-1 - k], rs[-1 - k])
        ret = x_dagger
    else:
        x = X
        for v, r in zip(reversed(vs), reversed(rs)):
            x = reconstruct(x, v, r)
        ret = x
    return ret