lbfgs-FFNN/layer_8hpp_source.html

 #pragma once

 #include "common.hpp"

 #include <Eigen/Core>

 #include <Eigen/src/Core/Map.h>

 #include <autodiff/reverse/var.hpp>

 #include <autodiff/reverse/var/eigen.hpp>


 namespace cpu_mlp {


 struct Linear {

   static inline double apply(double x) { return x; }

   static inline double prime(double /*x*/) { return 1.0; }

   static constexpr double scale = 1.0;

 };


 struct ReLU {

   static inline double apply(double x) { return (x > 0.0) ? x : 0.0; }

   static inline double prime(double x) { return (x > 0.0) ? 1.0 : 0.0; }

   static constexpr double scale = 1.41421356;

 };


 struct Sigmoid {

   static inline double apply(double x) { return 1.0 / (1.0 + std::exp(-x)); }

   static inline double prime(double x) {

     double s = apply(x);

     return s * (1.0 - s);

   }

   static constexpr double scale = 1.0;

 };


 struct Tanh {

   static inline double apply(double x) { return std::tanh(x); }

   static inline double prime(double x) {

     double t = std::tanh(x);

     return 1.0 - (t * t);

   }

   static constexpr double scale = 1.0;

 };


 class Layer {

 public:

   virtual ~Layer() = default;

   virtual void bind(double *params, double *grads) = 0;

   virtual void forward(const Eigen::MatrixXd &input, Eigen::MatrixXd &output) = 0;

   virtual void backward(const Eigen::MatrixXd &next_grad, Eigen::MatrixXd *prev_grad) = 0;

   virtual int getInSize() const = 0;

   virtual int getOutSize() const = 0;

   virtual int getParamsSize() const = 0;

   virtual double getInitStdDev() const = 0;

 };


 template <int In, int Out, typename Activation = Linear> class DenseLayer : public Layer {

 private:

   using MapMatW = Eigen::Map<const Eigen::MatrixXd>;

   using MapVecB = Eigen::Map<const Eigen::VectorXd>;


   using MapMatW_Grad = Eigen::Map<Eigen::MatrixXd>;

   using MapVecB_Grad = Eigen::Map<Eigen::VectorXd>;


   double *params_ptr = nullptr;

   double *grads_ptr = nullptr;


   Eigen::MatrixXd input_cache;

   Eigen::MatrixXd z_cache;


 public:

   DenseLayer() {}


   int getInSize() const override { return In; }

   int getOutSize() const override { return Out; }

   int getParamsSize() const override { return (Out * In) + Out; }


   void bind(double *params, double *grads) override {

     params_ptr = params;

     grads_ptr = grads;

   }


   void forward(const Eigen::MatrixXd &input, Eigen::MatrixXd &output) override {

     MapMatW W(params_ptr, Out, In);

     MapVecB b(params_ptr + (Out * In), Out);


     // Cache inputs for backward pass.

     input_cache = input;

     z_cache = W * input;

     z_cache.colwise() += b;


     output = z_cache.unaryExpr([](double v) { return Activation::apply(v); });

   }


   void backward(const Eigen::MatrixXd &next_grad, Eigen::MatrixXd *prev_grad) override {

     MapMatW_Grad dW(grads_ptr, Out, In);

     MapVecB_Grad db(grads_ptr + (Out * In), Out);


     // Apply activation derivative to incoming gradient.

     Eigen::MatrixXd dZ = next_grad.cwiseProduct(z_cache.unaryExpr([](double v) { return Activation::prime(v); }));


     // Accumulate parameter gradients.

     dW.noalias() += dZ * input_cache.transpose();

     db.noalias() += dZ.rowwise().sum();


     if (prev_grad) {

       MapMatW W(params_ptr, Out, In);

       // Propagate gradient to previous layer.

       *prev_grad = W.transpose() * dZ;

     }

   }


   double getInitStdDev() const override { return Activation::scale * std::sqrt(1.0 / (double)In); }

 };


 } // namespace cpu_mlp

cpu_mlp::DenseLayer
Fully-connected layer with activation.
Definition: layer.hpp:74

cpu_mlp::DenseLayer::bind
void bind(double *params, double *grads) override
Bind parameter and gradient storage.
Definition: layer.hpp:95

cpu_mlp::DenseLayer::getOutSize
int getOutSize() const override
Output dimension.
Definition: layer.hpp:92

cpu_mlp::DenseLayer::getInSize
int getInSize() const override
Input dimension.
Definition: layer.hpp:91

cpu_mlp::DenseLayer::getParamsSize
int getParamsSize() const override
Parameter count.
Definition: layer.hpp:93

cpu_mlp::DenseLayer::forward
void forward(const Eigen::MatrixXd &input, Eigen::MatrixXd &output) override
Forward pass for a batch.
Definition: layer.hpp:100

cpu_mlp::DenseLayer::DenseLayer
DenseLayer()
Definition: layer.hpp:89

cpu_mlp::DenseLayer::getInitStdDev
double getInitStdDev() const override
Initialization scale.
Definition: layer.hpp:130

cpu_mlp::DenseLayer::backward
void backward(const Eigen::MatrixXd &next_grad, Eigen::MatrixXd *prev_grad) override
Backward pass for a batch.
Definition: layer.hpp:112

cpu_mlp::Layer
Abstract layer interface.
Definition: layer.hpp:52

cpu_mlp::Layer::bind
virtual void bind(double *params, double *grads)=0
Bind parameter and gradient storage.

cpu_mlp::Layer::getInSize
virtual int getInSize() const =0
Input dimension.

cpu_mlp::Layer::forward
virtual void forward(const Eigen::MatrixXd &input, Eigen::MatrixXd &output)=0
Forward pass for a batch.

cpu_mlp::Layer::getInitStdDev
virtual double getInitStdDev() const =0
Initialization scale.

cpu_mlp::Layer::~Layer
virtual ~Layer()=default

cpu_mlp::Layer::getOutSize
virtual int getOutSize() const =0
Output dimension.

cpu_mlp::Layer::backward
virtual void backward(const Eigen::MatrixXd &next_grad, Eigen::MatrixXd *prev_grad)=0
Backward pass for a batch.

cpu_mlp::Layer::getParamsSize
virtual int getParamsSize() const =0
Parameter count.

common.hpp
Common aliases and utilities shared across CPU components.

cpu_mlp
Definition: layer.hpp:13

cpu_mlp::Linear
Linear activation (identity).
Definition: layer.hpp:16

cpu_mlp::Linear::prime
static double prime(double)
Definition: layer.hpp:18

cpu_mlp::Linear::scale
static constexpr double scale
Definition: layer.hpp:19

cpu_mlp::Linear::apply
static double apply(double x)
Definition: layer.hpp:17

cpu_mlp::ReLU
ReLU activation.
Definition: layer.hpp:23

cpu_mlp::ReLU::apply
static double apply(double x)
Definition: layer.hpp:24

cpu_mlp::ReLU::scale
static constexpr double scale
Definition: layer.hpp:26

cpu_mlp::ReLU::prime
static double prime(double x)
Definition: layer.hpp:25

cpu_mlp::Sigmoid
Sigmoid activation.
Definition: layer.hpp:30

cpu_mlp::Sigmoid::scale
static constexpr double scale
Definition: layer.hpp:36

cpu_mlp::Sigmoid::apply
static double apply(double x)
Definition: layer.hpp:31

cpu_mlp::Sigmoid::prime
static double prime(double x)
Definition: layer.hpp:32

cpu_mlp::Tanh
Tanh activation.
Definition: layer.hpp:40

cpu_mlp::Tanh::apply
static double apply(double x)
Definition: layer.hpp:41

cpu_mlp::Tanh::scale
static constexpr double scale
Definition: layer.hpp:46

cpu_mlp::Tanh::prime
static double prime(double x)
Definition: layer.hpp:42